赶“ChatGPT”潮的云知声

发布一下 2023年06月02日 13:41 0 0

撰文 | 田小梦

编辑 | 李信马

题图 | IC Photo

“去年12月份，我第一次看到ChatGPT的时候，是我创业十年中最灰暗、最沮丧的时候。ChatGPT所表现出的几乎百分之百准确的理解能力，以及前所未见的‘生存’能力，这让我们这些理工男能够安身立命的技能，好像瞬间没有了价值。”黄伟惆怅道。

面对ChatGPT的横空出世，发布仅5天注册用户就超100万的冲击，黄伟有差不多一周的时间里处于焦虑的状态。但这种焦虑，也让他有了解和钻研ChatGPT的冲动。通过网上的文章、论文等，以及与技术负责人交流后，在他看来，ChatGPT好像也没什么，它就像是一个做的更大的transform。

从挫折、沮丧，再到发现——“好像我们也可以”。正是抱着这样的期待，云知声在去年12月中下旬快速组建了团队，投身于大模型的研发过程中。今年2月底就研发出第一版“山海”大模型。黄伟感慨称：“看到一版的时候，我整个的感觉和我在十年前创业的第一刻是一样的。”

但伴随互联网巨头的加入，虽然为科技公司指出了发展的新路径、新机遇，但对于创业公司来说，这条路并不轻松。

在黄伟看来，人工智能正从1.0进入到2.0时代，但目前只是在2.0的起点位置。1.0时代，人工智能更多的是一种鉴别能力，即利用已有的数据来训练模型，让模型做出Yes or No的判断，但无法告知原因。而2.0时代，在大模型引领的AI 2.0时代，为人工智能带来了新的能力，可以打造更多新的产品，满足客户更多的需求，例如医疗、营销、沟通等，能够创造更多的商业机会。

同时，从数据来看，今天的数据还没充分发挥它应有的价值，而通过大模型的深度学习可以充分利用和使用数据价值。黄伟认为，大模型会成为人工智能2.0时代的“发电厂”。“谁拥有发电厂，谁就具有最大的商业价值。”

在业界都将目光锁定在大模型身上，并认为大模型是未来十年20年最大的机会之一时，云知声自然也不会放弃。再者，云知声在过去十年里，积累了大量算法、数据、工程落地经验，仿佛都是为“山海”而生。

天时地利加人和，这不正是云知声在去年12月份毅然决然投身大模型的底气。

图片来源：云知声

如今，“山海”大模型完成多轮优化升级，拥有超过十项技术能力。在通用能力上，包含语言生成、语言理解、知识问答、推理能力、数学能力、代码能力，以及与人类对齐的安全合规能力；在落地能力上，提供插件扩展、领域增强，以及企业定制能力。

01.

年内通用能力比肩ChatGPT

“目标年内通用能力比肩ChatGPT，并在医疗、物联、教育等多个垂直领域能力超越GPT4。”黄伟在发布会线上扬言称。这也透露出，云知声不是简单的将目光锁定在通用能力上，更看侧重TO B的落地场景中。

当然这步棋子的布局，离不开黄伟的经验。他从学术界到工业界，再到创业，完整的做过产品，深知人工智能只是一种能力，不能仅做酷炫的外表，而是要做完整的闭环。

其实，从云知声的发展也可以窥见一二。

2012年成立时，云知声就开始做自然语言理解，投入在整个对话AI的全栈能力研究中，形成数据、算力和算法完整的能力链条。2016年，当DeepMind AIphaGo 4:1 击败李世石时,云知声敏锐的意识到，人工智能的本质是认知智能，自然语言理解才是人工智能皇冠上的明珠，并在2016年年初开始布局超算——Atlas，并躬身入局物联网、医疗等领域，收获了真实的行业场景和数据。基于此，2022年云知声紧抓机遇，开启“山海”大模型研发，实现云知声的AI三级跳。

图片来源：云知声

在这新一轮的人工智能比拼中，为了提高大模型在具体场景的应用落地水平，云知声沿袭了一以贯之的U+X战略，即以 U(AI技术和产品能力)，深度结合 X(行业应用场景)，解决行业深层问题。

黄伟介绍称，山海大模型技术架构就是通用大模型，并针对知识密度高的领域，通过数据训练、训练数据、微调等方式，做一些专业的加强，这样模型既具备了通用应用水平，也针对特殊场景与领域进行了能力的加强。

如在医疗领域，以前医疗行业利用AI的方式去录入病例，但是医生依然需要逐字录入信息，如今借助山海大模型，只需要随着医患问答的过程中，就能够提取关键信息生成病例，提高了医疗的效率，同时，云知声在为医疗服务中积累的千万级的标准的医疗数据，并背靠国内最大的医疗知识数据图谱，使得山海大模型在MedQA评测能力中可超越GPT-4。

云知声科技董事长兼CTO梁家恩表示，就目前而言，大模型仍然是有限的东西，对于没有见过的东西，大模型会生成“似是而非”的回答，随着AI生成能力的不断增强，校验会更加困难，这也让AI行业需要不断去探索新的解决方法。

随着AGI时代的到来，云知声也迎来了自己的GPT时刻。“如果把通用大模型看作每科都能考到80分的学生，我们要做就是在某一两门学科上，考到95分甚至更高。”黄伟如是说。

02.

突围行业大模型

在这场声势浩大的 AGI 浪潮中，大模型与具体应用场景的深度融合已成必然。

近日，互联网大佬纷纷表态，百度创始人、董事长兼首席执行官李彦宏表示：“以后的应用、软件，基本都会基于大模型来进行开发。而产业界的变化，意味着很多新机会，其中一个方向就是AI for Science。”网易CEO丁磊认为:“AI的发展可以用百花齐放、百家争鸣来形容，但其中落地场景最关键。”

经过近几个月国内大模型的混战，除通用能力外，在B端已经开始拼场景、抢客户。

例如，第一个吃螃蟹的文心一言，其定位是一个通用的赋能平台，金融、能源、媒体、政务等千行百业。据了解，百度智能云大模型目前已经与不同领域客户联合研发，在智能办公、旅行服务、电商直播、政务服务、金融服务五大领域打造行业样板间。

阿里继发布大模型产品“通义千问”之后，阿里云先接入阿里“通义千问“大模型，又推出钉钉魔法棒功能。目前阿里云敲定了一系列生态伙伴——昆仑数智、中金财富、用友网络、亚信科技等七家数字化服务商成为首批伙伴，覆盖油气、电力、交通、金融、酒旅、企服、通信行业。

除“文心一言”“通义千问”为代表的互联网企业外，科大讯飞的“星火” 认知大模型也实现了应用落地，围绕“星火”认知大模型“1+N”架构中“N”个领域的内容，科大讯飞发布了大模型在教育、办公、汽车、数字员工等多个方向的行业应用成果。

图片来源：云知声

而同样在AI语音领域有一席之地的云知声，其市场策略上坚持“U+X”战略，在发布会线上除演示上述的医疗领域外，还在销售、知识管理、教育、智慧物联等方向有所落地。

不难看出，在这场AI对决中，无论是大厂还是创新企业的制胜点，不仅包括自身大模型的技术实力，还有大模型所赋能的场景，以及为合作伙伴带来的价值。

如今，企业发布大模型等同于拿到了进入AGI的门票，但场景的交叉、商业模式的落地，却打响了大模型落地的“发令枪”。谁能在这场博弈中突出重围，还有待考验。

本文源自iDoNews

本文地址：http://0561fc.cn/210200.html