在山海大模型发布会现场,黄伟有一句话令人印象深刻,“云知声的过去十年,就是为山海而生。
作者| 皮爷
出品|产业家
“谁能做成中国最好的大模型?”在今年3月一个北京投资人的内部分享会上,有人满怀期待地提出这样一个问题。但可惜,这个问题没有答案,或者说没人可以论证自己的答案。
在过去的几个月时间里,伴随着ChatGPT这款现象级产品的出现,大模型的热度只增不减,不论是互联网大厂,还是新兴的互联网创业者,抑或是传统AI企业,推出的大模型如雨后春笋般出现在市场。
根据不完全统计,今年3月以来,中国市场已经出现超过30款大模型产品,其覆盖领域除了固有的通用大模型,更有专门面向细分赛道的中模型(产业模型),如低代码、工业、能源等等。
但两个月过去了,文章开篇的问题依旧没有答案。
几个最现实的问题是,伴随着大模型数量的增加,市场对大模型产品本身抱有更现实,或者说更审慎的态度,即大模型究竟能解决什么问题?在智能对话、逻辑推理之外,大模型距离能落地到真实的产业场景,还有多远的路要走?它需要多久才能转化为真正的社会生产力?
问题背后,对应的不仅是市场对大模型产品的深度思考,也更是对当下中国数字化、智能化未来的方向探索。大模型产品背后的企业需要用更落地的动作,完成自证。
最近,产业家连线了云知声创始人兼CTO梁家恩博士,从他的视角来理解这次大模型浪潮到底意味着什么,以及对云知声,这家AI赛道的老兵而言,它正在交出的是一张怎样的答卷。
在他和云知声看来,变化和自证,已然在路上。
一 、云知声,「交卷」
511分——这是在云知声大模型发布现场,云知声创始人黄伟公示的一个分数。它是云知声山海大模型能在临床执业医师医学考试中拿到的分数,这个考试总分是600分,而参加考试的考生平均分是365分。
在医疗领域,MedQA评测也超过81分,这是一张超过GPT-4的成绩单。
“我们想经过领域增强训练,让大模型在专业领域从本科训练到博士。”梁家恩告诉产业家。而在医疗领域,这个想法正在落地。
这也正是这次云知声山海大模型发布会的不同之处。即在市面上大模型现场展示的语言对话能力、逻辑推理能力之外,山海大模型传出的声音也更多在集中产业层面,比如医疗、家居、教育、汽车等多个产业领域。
以医疗领域为例,人们不仅可以基于某个病症获得准确的医疗答案,在临床中,医生更可以通过语音生成病历关键词,在山海大模型的辅助下,基于病历辅助医生生成完整的病历方案;同时也更可以帮助患者和保险公司进行医疗相关的保险理赔。
再比如在物联网领域,山海大模型可以实现主动智能、情感化回复以及多轮复杂对话等等,像钢铁侠里的“贾维斯”一样帮助人们安排日程,成为智能物业管家。
此外,山海大模型还可以成为特定领域的“销售专家”“知识管理专家”“口语专家”等等,基于大模型对特定的产业场景进行深度赋能。
“现在基本上OpenAI等机构列出的开源英文语料类别和中文语料类别,我们都已经进行了训练,还增加了自己的中文和医疗数据。”梁家恩告诉我们。
根据云知声的“U+X”战略,山海大模型交出的这张答卷不仅在通用大模型的“肌肉”上,如常规的语言生成、语言理解、逻辑推理、数据和代码能力、安全合规能力,也更在具体的产业落地上,即通过插件扩展、领域增强和企业定制,在专业的产业领域实现更针对性的落地和适配。
这是一张怎样的答卷?
二 、从专用到通用,路径背后的AI TO B
“比如如果OpenAI通用能做到95分,但很多专业领域可靠性还达不到实用化要求;我们的通用基座可以做到90分,然后会优先在不同领域分别进行强化,最终能在领域里落地。”梁家恩表示。
伴随着OpenAI的持续大火,在人们惊叹AI迎来转折点的同时,一些隐性的问题也更在出现,比如对GPT模型而言,其目前更展现的价值点在通用板块,如对语义的理解,逻辑推理等等能力,但在具体的产业侧,它必须要进行针对性的训练才能满足基本要求。
其中,医疗是当下人们谈论最多的领域,作为一个“严肃”的学科和领域,其医疗对大模型在训练过程中出现的“幻觉”现象可谓是零容忍,换言之,如果大模型想要在医疗领域落地,就必须进行足够专业的数据训练和微调,才能实现“产业化”。
也可以说,如果说金融行业是数据库等国产厂商能力自证的高地,那么医疗作为复杂度和知识密度极高的行业,恰可以看作是大模型具备产业赋能能力的最强磨刀石。
“在此之前,我们做了大量的医疗智能化案例,有大量的医疗数据积累,以及全面的知识图谱能力,这是我们预先选择医疗方向的基础。”梁家恩告诉我们。
这是云知声一直选择出击的方向。以云知声的「医疗语音录入系统」为例,其可以让医生通过说话实时把文本录入到希望输入的地方,解决固有的“一边交流,一边记录病历”的问题,释放医生在病历誊写上的时间。
据了解,这套系统的语音识别准确率达到 95% 以上,尤其在神经科、免疫内科、血液科、普通内科等疑难杂症患者多的科室应用效果好,个别科室的语音识别率甚至超过 98%。
类似的医疗智能化案例在过去几年是云知声发力的主要方向之一,而这些智能化的解决方案和数据如今都被训练到山海大模型中。据了解,接下来,山海大模型将在国内头部三甲医院陆续落地。
和医疗类似,物联网也是云知声山海大模型重点落地的一个方向。基于大模型的能力,云知声可以在原有的AIOT生态基础上做到智慧物联3.0。同样的,这项能力如今也已经在部分智慧产业园区等场景中逐渐落地。
医疗、物联网对应的方向也恰是云知声在走的大模型路径——由专用走向通用。即相较于在通用大模型的底座上不断进行通用数据叠加,云知声的做法是在底层通用底座的基础上,直接到专用(产业)领域进行针对化的训练,“逐步把每个领域都做到博士水平”,最终反哺底座大模型实现更为准确的产业表达。
实际上,这恰是最符合当下产业落地的大模型路径。即真正从产业的问题和实际情况出发,进行相应的产业模型表达,通过一个个专业领域的模型能力沉淀,最终做到底座大模型的“通用化”和“专业可靠”。
此外,伴随着产业数据的不断涌入,云知声通过优化后的框架和梳理过的高质量数据,保证大模型具备“抗臃肿”属性的同时,实现模型的准确度和产业服务能力。
“数据并非越多越好,包括学术界大家也在讨论,在达到一定的数据量后,模型的准确度和效果就不会随着数据量的增加而不断优化,数据质量和多样性更关键。”梁家恩告诉我们,“最终还是要回归到框架和数据的优化。”
如果把时间线往前翻,早在2016年,云知声团队就开始建立大规模超算平台Atlas,在这个希腊神话里代表泰坦族擎天神的平台之上,云知声开始了如前文所说的医疗、物联网等产业方向的AI赋能尝试。
“所以,现在单纯堆数据对云知声来说是没有任何难度的,难度在于在一个个具体的产业里能实现落地,可靠并且可用。”梁家恩表示。
三 、大模型时代,被释放的「AI力」
如果从更大视角来看云知声选择的路径,会发现一切并非偶然,注重工程优化和产业规模化能力是其突出特点,也更不是一条容易的路。
比如,2016年底层Atlas平台建立时,云知声还仅是一个成立4年的创业公司,“硅谷的专家甚至惊讶,一家成立四年的创业公司考虑这个问题还太早。”
比如,在Atlas平台之上的数据中心模型优化(DCML)层。在2016年云知声开始进入医疗行业后,逐步意识到解决不同医院和科室的数据差异性,是实现规模化应用的关键,就开始构建“统一模型架构+数据迭代调优”的开发模式,即将AI能力能够更为标准化地应用到各个领域,进而实现AI能力的泛“标准化”,就是现在支撑山海大模型训练的DCML平台。
再比如,同样是在2016年,云知声将行业内普遍认为的“靠GPU才能跑起来”的深度学习技术,优化到能在CPU甚至手机芯片上跑起来。同时期,他们甚至把模型做进了主频只有200MHz、计算内存只有200k的WiFi芯片中。
这些在当时看来“不合常理”“超前、费力”的布局,如今都在构成着云知声在这场新的大模型潮水中交出自己答卷的底气。不论是医疗,还是家居,再或者是如今云知声正在深入“教育”等行业,山海大模型都能基于完整的技术支撑实现快速的适配和落地。
梁家恩告诉我们,现在山海大模型在本地部署,企业只需要使用“A10”级别的GPU,就可以达到使用“A100/A800”的推理效果,前者成本仅1万人民币左右,而后两者成本均超过上万美元,本地部署成本降低甚至可以超过80%,后续还可以进一步优化。
在技术支撑之外,基于过往在医疗等行业服务的经验,云知声可以更为迅速地在其它领域进行知识图谱的搭建,配合大模型做到更专业的落地。这是所有AI企业都在实践的路径,当同时兼具大模型和知识图谱能力的团队并不多。
用梁家恩的话来说就是,“如今云知声正在进行第三次技术升级。”如果说2016年,云知声完成的是从“声(感知)”到“知(认知)”的全栈技术体系升级,那么在2022年开始,这家AI企业正在完成的是从“专用AI走向通用AGI”的升级。
不过,今天又和2016年云知声面临的情况不同。
即尽管2016年云知声不论是从底层超算平台,还是上层的数据模型,再或者是基于医疗行业的深入,都在进行创新式的尝试,并验证了企业自身前进的路径。但在当时的时间点,不论是AI能实现的功能和不同行业的复用性,还是人们对AI的认知,都停留在浅层面。
可以理解为,之前AI的生产价值更多的是“专用业务系统+标准AI零部件”的组装模式,业务层的标准化和复用性相当不足,理解能力和灵活性上都有瓶颈;但现在伴随着大模型的出现,可以通过自然语言对接大部分任务,智商显著提升,且能通过大模型调优而非编程方式拓展业务能力,MaaS模式开始成为可能,它正在重新定义AI在企业数字化转型中的位置和作用,更为具体化,也更为有实操性。对AI企业而言,其也对应的是更强大且能够复用的产品技术价值。
换言之,大模型打破了市场对如云知声这样的AI企业设定的业务边界和商业价值的认知壁,重新认识到整合语言、知识、推理、决策等认知能力的大模型,对业务智能化的核心价值和重要意义,它们能做的事情、未来能达到的想象空间,都在有了更新的界定。
而这些的基础,也恰都建立在云知声这样的企业在过往多年的技术坚持和市场探索。在这个AI正在成为社会核心生产力的当下,云知声们正在成为真正的主角。
在山海大模型发布会现场,黄伟有一句话,令人印象深刻,“云知声的过去十年,就是为山海而生。”
写在最后:
云知声的大模型路径可以总结为“产业AI”。即市面上不少大模型的路径是,先进行大模型的底层训练,训练到一定数量级再去寻找能够落地的产业场景和价值。
但云知声的目的和方向都很明确,即初始方向就是在通用大模型的基础上,实现某个专用(产业)的模型能力增强和落地,并且先在医疗和物联等优势产业验证,再拓展不同应用场景分别进行训练尝试,衡量标准是模型是否能在产业内可用、可靠、有价值。
从大模型没有达到终局的现阶段来看,虽然不能论路径的对错与否,但云知声等企业的路径更能让大模型与真实世界产生交集和连接,并且由此一步步转化为真实可见的生产力,不单纯完成TO C的呈现,更实现了在产业侧的“非泡沫”论证,在具体的医疗产业侧,目前其效果和能力更是在超过GPT-4。
这是云知声带来我们的思考,也更是中国AI技术的一次新的自证。