「京圈公子历练,全汉东疯了」

第1082章 数据银行!

上一页 简介 下一页

第1082章 数据银行!(4/5)

一张曲线图,“模型的能力跟训练数据量的关系不是线性的——在达到一个阈值之前,模型的表现很平庸。越过阈值之后会出现能力涌现。根据我的估算,工业大模型的涌现阈值大约在一亿组高质量设计案例。”

“你现在手里有多少?”

“盘古造物系统自身积累的用户数据,大约两百万组。加上陈默研究所这些年攒的公开数据集,凑到三百万组顶天了。”

苏哲看了他一眼。

“差多少你自己心里有数。”

“差九千七百万组。”

这个数字在办公室里挂了几秒,像一个没人想碰的重物。

杨青被叫来的时候,脸上的水泡又起了一颗新的——上一颗刚好,这颗长在了嘴角另一侧。他现在两边嘴角对称地各有一个红点,像被什么东西叮过。

“数据共享倡议?”杨青听完需求,脑子转得快,“直接给十二万家企业发?”

“先发通知,摸底意愿。”苏哲说。

通知发出去的第二天,杨青在高新区管委会的办公室里对着电脑屏幕发呆。

回复邮件一共六百一十三封。同意共享数据的——四十七封。其中三十九封来自京海本地企业,且大部分是已经跟市政府有深度合作关系的。

剩下五百六十六封,措辞五花八门,但核心意思一致:不给。

最有代表性的是宁波锦通精工的回复——就是之前投诉数据溢出那家。措辞很文气,但字里行间扎得人疼:“我方对贵方系统的技术能力表示认可,但设计数据涉及客户商业秘密和企业核心竞争力,无法对外共享。望理解。”

杨青把邮件汇总打了出来,走到苏哲办公室。

苏哲翻了三页就放下了。

“意料之中。”

“那怎么办?”杨青的水泡开始隐隐发疼。

“别急。先看看对面在干什么。”

对面在干什么,威尔逊当天夜里就发来了消息。

OpenAI在旧金山总部召开了一场闭门发布会。受邀参加的只有三十家顶级制造业企业的CTO和西门子数字工业部门的高管。发布会上展示了一个代号“Forge”的工业版GPT原型——功能跟陈默演示的东西高度相似:自然语言输入产品需求,自动输出设计方案和加工路径。

但Forge的演示效果比陈默的原型好得多。它不仅能生成单个零件的设计,还能根据装配关系自动生成整套机构的三维模型。

威尔逊的情报来源说,Forge的训练数据量在四亿组以上。


本章还未完,请点击下一页继续阅读
上一页 目录 下一页 存书签

相关推荐

京圈公子历练,全汉东疯了