扫码阅读
手机扫码阅读

Kafka测试初探【Go】

70 2024-04-08

上周分享了Kafka性能测试初探的Java版本,有读者留言说太简单,内容比较水。这里澄清一下,是我学得比较水。文章定位就是一篇使用Java语言的Kafka Client客户端进行简单操作演示,然后模拟一下简单场景的性能测试。其中深入学习Kafka的可以随处搜到很权威实用的资料,有深入学习需求的可以自行寻找。

好久没有写Go了,这才突然觉察到,又重新复习了一波Go语言的基础语法。顺带着之前留下的好习惯,每个学习的框架和工具都用Java和Go写一遍。这次也分享一下Go语言的Kafka基础入门,以及生产者的简单测试场景。

我用的是shopify出的sarama,依赖如下github.com/Shopify/sarama v1.38.1。在搜资料的过程中,还发现有使用其他客户端的,选择挺多。

Kafka配置

Sarama框架中的生产者和消费者的配置类是一个,不太清楚这么设计的意图,两个配置重合度并不高,在Sarama中也是分开配置,但使用了同一个配置类。

生产者配置:

 config := sarama.NewConfig()
 config.Producer.Return.Successes = true config.Producer.Return.Errors = true config.Producer.RequiredAcks = sarama.NoResponse
 config.Producer.Compression = sarama.CompressionLZ4
 config.Producer.Timeout = time.Duration(50) * time.Millisecond
 config.Producer.Retry.Max = 3 

消费者配置:

 config := sarama.NewConfig()
 config.Consumer.Offsets.AutoCommit.Enable = true config.Consumer.Offsets.AutoCommit.Interval = 1 * time.Second
 config.Consumer.Offsets.Initial = sarama.OffsetOldest
 config.Consumer.Offsets.Retry.Max = 3 

这里只选择部分参数,详细的配置项和注释都可以在源码中找到,Sarama的一个好处就是注释非常全,甚至不用看官方API文档。

生产者

下面是生产者的代码,相比较Java来说,我这里增加了header的实践,其实Java也是支持的,只是当时学的时候漏掉了这个知识点。

producer, err := sarama.NewSyncProducer([]string{"localhost:9092"}, config) if err != nil {
  log.Fatal(err) return } defer func() { // 关闭生产者 if err = producer.Close(); err != nil {
   log.Fatal(err) return }
 }() // 定义需要发送的消息 headers := []sarama.RecordHeader{sarama.RecordHeader{
  Key:   []byte("funtest"),
  Value: []byte("have fun ~"),
 }}
 msg := &sarama.ProducerMessage{
  Topic: "topic_test",
  Key:     sarama.StringEncoder("test"),
  Value:   sarama.StringEncoder("ddddddddddddddddd"),
  Headers: headers,
 } // 发送消息,并获取该消息的分片、偏移量 for i := 0; i < 100; i++ {
  ftool.Sleep(1000)
  partition, offset, err := producer.SendMessage(msg) if err != nil {
   log.Fatal(err)
  }
  fmt.Printf("partition:%d offset:%d\n", partition, offset)
 } 

这里官方给的实践代码中感觉ProducerMessage类似于Java的org.apache.kafka.clients.producer.ProducerRecord#ProducerRecord,也是可以指定partitionid和时间戳,以及单独设置retries次数的。还有一个比较重要的类AsyncProducer,暂时不探索了。

消费者

消费者使用上Go和Java差异比较大,Sarama用了channel的概念,可以一直不停止从服务端获取消息对象,不像Java可以指定一次接受的消息数量,单次最大等待时间等。盲猜这里channel的性能太好了吧,不需要复杂设计也能满足需求。

 consumer, err := sarama.NewConsumer([]string{"localhost:9092"}, config) if err != nil {
  fmt.Printf("fail to start consumer, err:%v\n", err) return }
 topic := "topic_test" partitionList, err := consumer.Partitions(topic) // 根据topic取到所有的分区 if err != nil {
  fmt.Printf("fail to get list of partition:err%v\n", err) return }
 fmt.Println(partitionList) defer consumer.Close() for partition := range partitionList { // 遍历所有的分区 // 针对每个分区创建一个对应的分区消费者 log.Println(partition)
  pc, err := consumer.ConsumePartition(topic, int32(partition), sarama.OffsetOldest) if err != nil {
   fmt.Printf("failed to start consumer for partition %d,err:%v\n", partition, err)
  } for msg := range pc.Messages() {
   log.Println(string(msg.Value)) //log.Println(string(msg.Headers[0].Value)) } for {
   msg := <-pc.Messages() log.Println(string(msg.Value))
  }
 } 

后来我写了两种接受方式,其实都是阻塞的,如果是性能测试的时候可以使用Go中的go关键字起routine来执行。

性能测试

我这之展示性能测试简单的例子,即生产者不停地往Kafka发消息的Demo,复用了上文中的生产者代码,下面只展示执行部分。

execute.ExecuteRoutineTimes(func() {
 _, _, _ := producer.SendMessage(msg)
}, 100, 10) 

执行方法ExecuteRoutineTimes是我写的一个基于线程模型的压测执行方法,内容如下:

 // ExecuteRoutineTimes // @Description: FunTester性能测试执行框架 // @param fun 待执行方法 // @param times 次数 // @param routine 线程数 func ExecuteRoutineTimes(fun func(), times, routine int) {
 c := make(chan int) //确认所有线程都结束 key := false //用于控制所有线程一起结束 start := ftool.Milli() for i := 0; i < routine; i++ { go func() {
   sum := 0 for i := 0; i < times; i++ { if key { break }
    fun()
    sum++
   }
   key = true c <- sum }() } total := 0 for i := 0; i < routine; i++ { num := <-c total += num } end := ftool.Milli() diff := end - start //total := thread * times log.Printf("总耗时: %f", float64(diff)/1000)
 log.Printf("请求总数: %d", total)
 log.Printf("QPS: %f", float64(total)/float64(diff)*1000.0)
} 

总结起来,相比Java,Go语言相对简单一些。如果习惯了Go语言的习惯,对于做测试来说上手要比Java快一些。再买个坑,改天测试一下两者之间的性能差异。理论上Go要比Java好一些。

FunTester原创专题推荐~

Sarama是一个用于Apache Kafka的Go语言库。Kafka是一个分布式流处理平台,它可以处理大规模的数据流,并将其发布到主题中,供其他应用程序使用。Sarama库允许Go应用程序与Kafka集群进行通信。它支持多个版本的Kafka协议,并提供了生产者和消费者API,以便应用程序可以轻松地将消息发布到Kafka主题或从中读取消息。Sarama还提供了一些有用的工具,如分区选择器和负载平衡器,以帮助开发人员更好地管理Kafka消费者。

-- By FunTester
原文链接: http://mp.weixin.qq.com/s?__biz=MzU4MTE2NDEyMQ==&mid=2247499341&idx=1&sn=38457a6a7239d40fc80231188a46fc59&chksm=fd49737bca3efa6da49fdc26947439bc14c5229a2a8960477d1e3651b11d12fb86b23b0b91bc#rd