第875章 第一代AI大模型新思NewMind诞生(2/4)
眼窝深陷很明显是连日熬夜睡眠不足的缘故,不过头发倒是很浓密,就是乱蓬蓬的像个鸟窝。
「我说,周胜铉,你简直像个野人啊.....」方青叶开起玩笑来。「还有黄桦,就你现在这邋遢样,你回家梅朵让不让你进门?」
「嘿嘿.....」黄桦一笑:「我已经三天没回家了,幸亏一身邋遢,否则梅朵认为我又跑到那个夜店鬼混去了。」
这小子,没结婚最喜欢干的事就是泡夜店,差点把苗宏斌的儿子苗伟带坏,不过结婚后听说老实许多,当然工作也很忙根本没时间花天酒地。
开了几句玩笑,方青叶坐下,路雅楠已经给他倒好茶水,他又看著周胜铉:「成了?」
「嗯!」周胜铉点点头:「我们经过语言能力、知识能力、对话与交互能力、推理与问题解决能力、多模态能力、创造性能力等十余项国际公认的AI大模型评测标准,全部通过。」
「当然还有些不满意的地方甚至BUG,还需要进一步优化和调试,下一步我们准备开放大模型的网页埠以及开发APP,推向市场。
「胜铉,我记得五月份你汇报时还说N.0.V.A.遇到技术瓶颈,进展停滞,怎么突然就突破了?」方青叶问出心中的疑惑。
「这得感谢黄桦,」周胜铉语气诚恳,「是他建议彻底抛弃原有的底层架构,采用一种全新的架构,我们才得以快速突破。」
虽然自己这个搭档看上去懒散有些不靠谱,甚至夸夸其谈、自我标榜,但于起活来确实没得说,尤其是脑瓜子聪明,虽然只是硕士,但团队里有些博士还聪明。
不过一向爱自夸的黄桦这次却格外谦虚:「我也是站在巨人的肩膀上—一开个玩笑。其实是受到谷歌那篇《AttentionIsAIIYouNeed》的启发————之前我们走错了路。」
原来,周胜铉的团队在方青叶的安排下从三年前就开始秘密对AI大模型的研发。
用的是国际上所流行的循环神经网络(RNN)和卷积神经网络(CNN)架构,但研发到最后总无法达成预定目标,因为无论是RNN或者CNN都有没办法克服的问题:
无法有效处理序列数据尤其是长序列!
这个缺陷是致命的!
黄桦打了个比方:「它就像一个试图解读整本《红楼梦》的学者,却被强制要求每次只能通过一个钥匙孔去看一个单词。」
「他或许能理解当前的词汇,却永远无



