文章详情

ChatGPT第二大分支:中文语料

02-10     浏览量:75

逻辑驱动:chatgpt正常运行需要大量的算力数据。算力成本很高,同样数据成本也很高算力已经炒过。后面市场会怎么炒,就很明显了。一定会延伸到数据,ai计算需要啥数据呢?专业术语叫语料。就是喂给程序进行分析计算的原材料。互联网上很多文字资料,但是却不能使用,原因是因为质量不高。训练需要高质量的语料才能训练出好的回答结果,OpenAI最开始就因为使用互联网公开数据训练出的回答出现大量脏话。高质量就需要人工审核整理出一个很大的数据库。就叫做语料库为什么看好中文语料呢?两点原因:1.chatgpt如果要把中文回答做好,就需要大量高质量的中文语料。2.国内跟随做类似chatgpt的大厂(百度,360,字节,阿里,腾讯.....),也需要优质中文语料。重点就是:寻找具有高质量中文语料的公司。推荐两只票在下面。注:三天前我的上一篇文章早于市场预测了GPU。推荐的三支票也是:两个10cm,一个15cm,一个20cm 链接:《ChatGPT第一大分支:GPU是核心算力,经济日报:夯实人工智能算力底座》 https://www.jiuyangongshe.com/u/fe5337c05dd54aa89646d26e1d705abf只做低位逻辑分析!!!

 

相关推荐