百度今日在微博表示,已注意到对文心一言文生图功能的相关反馈,并回应说明如下:

1、文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。

2、在大模型训练中,我们使用的是互联网公开数据,符合行业惯例。大家也会从接下来文生图能力的快速调优迭代,看到百度的自研实力。


【资料图】

百度方面还称,文心一言正在大家的使用过程中不断学习和成长,请大家给自研技术和产品一点信心和时间,不传谣信谣。

早前,有自媒体博主在社交平台发文称,“百度最近推出的那个会画图的人工智能”文心一言,有套壳、画皮、造假的嫌疑。

上述博主尝试了让文心一言画了许多会产生“中英歧义”词组短语。他发现,输入“鼠标和总线”,文心一言会自动生成“老鼠和公共汽车”。博主认为,这是由于“鼠标”和“总线”的英文是“mouse”和“bus”,文心一言显然对输入的中文进行了机器翻译。

同样的例子还有“一可以豆子”,这并非正常的汉语词组。但文心一言自动生成了“一罐头豆子”的图画。该博主指出,这是由于“一可以豆子”机翻成英语,正是“one can bean”,即一罐头豆子的含义。

经过多次测试后,该博主推断,百度的所谓人工智能,其实是把中文句子机翻成英语单词,然后用国外刚刚开源的人工智能“Stable Diffusion”生成了图画。

对此,有IT业内人士认为,文心一言确实把输入的中文句子,通过机器翻译生成了英语单词。“但这是因为开源的图文数据大部分为英文内容。目前还没有上亿规模中文图文数据集。即使有,也噪声很大,基本不可以用。行业内都是用国外数据集,做中文映射,才导致这样的生成效果。”

亚洲视觉科技研发总监陈经也表示,百度的画图AI采用了英文标注的开源图片素材进行训练,因此需要中翻英来当prompt(提示词)。

“目前,全球AI研发有开源的传统,特别是训练数据库,不然大家自己收集图片效率太低了。而且图片是要标注的,这更加大了收集整理图片的难度。所以,百度拿英语标注的图片库进行训练,这也是开源的意义。当前也有中文标准的训练数据,但是少很多。”

陈经分析称,“由于发布时间仓促,百度对于画图AI的中文输入词还没完全搞定,才弄了个简单的中翻英来应对。后续应该会根据用户反馈,把中文的提示词与英文的训练素材更好对应上。”

关键词: