LOADING

小冰公司,打造国内“ChatGPT”的先驱

2024/05/12 一起用AI
499

小冰公司,打造国内“ChatGPT”的先驱

  来源 | 零壹财经

作者 | Chenglin Pua

ChatGPT的横空出世给了许多人对于人工智能的美好想象。国内也在寻找着国内的“ChatGPT”。小冰公司因从微软拆分出来,在近期更是抢先推出公测小冰链,希望能够打造国内第一个“ChatGPT”。

人工智能是个“吞金兽”,理解小冰公司的商业模式能够帮助探索未来人工智能领域潜在的收入来源。

就小冰与ChatGPT相比而言,因设计目的不同,小冰的产品与ChatGPT在不同场景下有着不同的优势。

小冰公司前身为微软(亚洲)互联网工程院人工智能小冰团队。该团队于2013年12月在中国组建。 2020年7月,微软宣布将人工智能小冰业务分拆为独立公司运营,成立小冰公司。2021年7月12日,小冰公司发布超级自然语音技术,并披露A轮融资完成。 2022年11月7日,小冰完成A+融资,总共1.38亿美元(约10亿人民币),估值为23.08亿美元。

小冰也是一款人工智能聊天机器人,旨在模仿人类对话,为用户提供个性化帮助。由于小冰能够与用户进行有意义且引人入胜的对话,以及其独特的个性和幽默感,在国内有一定关注度。近期更是因为ChatGPT而让人们对于投入关注。

小冰被应用于客户服务、在线教育和医疗保健等领域,还被集成到微信和QQ等流行的社交媒体平台中,允许用户在这些应用程序中直接与小冰聊天。

 01 

小冰的产品与商业模式

小冰的产品主要专注于自然语言处理和类人对话,使用深度学习算法来理解自然语言并模拟人类对话模式。

以产品线而言,小冰的产品可分为三类:

1.人工智能交互主体。例如前文提到的小冰聊天机器人及日本、印度尼西亚等国家地区的Rinna。上述人工智能以合作方式植入或嵌入第三方平台中,为第三方提供领先的人工智能交互体验。

2.人工智能交互框架操作系统,以客户(To B)或用户(To C)为品牌的第三方人工智能交互主体,通过小冰公司提供的工具进行创建、训练、运营和升级,再通过小冰公司提供的接口和指导进行跨平台部署,实现广泛的人工智能助理、对话机器人、销售助手和老年陪伴机器人等产品的落地。

3.为部分垂直领域提供的行业解决方案。例如金融(金融风控解决方案)、汽车(新一代智能车机交互系统)、内容产业(版权视觉设计平台与版权音乐生成平台)、体育(人工智能视觉辅助评分及训练系统)等。小冰还为医疗保健行业开发了一系列人工智能产品,包括帮助医生快速准确诊断疾病的人工智能诊断工具,以及帮助患者监测健康状况并获得个性化健康建议的健康管理平台。

小冰公司还发布了全新的超级自然语音技术,首次将人工智能语音自然度提升到与真实人类声音几乎无法分辨的程度,并支持通用全域场景。该技术突破单一场景限制,使人工智能交互主体能够在说话、交谈、歌唱等人类全场景中,进行高度拟人交互。目前,小冰框架中的数百个不同人工智能原型主体已全部完成。

如今小冰公司的产品已成熟应用于多个场景中,例如2022年世界杯解说员刘建宏的虚拟人分身、每日经济新闻的AI电视栏目、招商局的数字员工等。目前,小冰还在老年人陪护、游戏NPC等应用场景中进行着新的尝试、探索人工智能新的应用场景,例如进入汽车行业成为多家大型车企智能座舱的供应商等。

小冰的产品之所以成功,有几个因素。

首先,小冰的开发得到了微软这家老牌科技公司的支持,有着技术上的优势。再者,小冰的产品被设计成用户友好和易于访问,可通过多种平台访问,包括手机、智能扬声器和社交媒体应用程序,使其成为热门选择。

小冰的商业模式基于为企业和消费者提供人工智能服务。

如前所述,对于企业层面,小冰提供了一系列服务。例如电商领域,小冰的人工智能技术可以帮助商家自动化客服查询,提供个性化的产品推荐。小冰还提供定制解决方案以满足个别企业的特定需求。这些解决方案可以帮助公司改善运营、简化流程并增强客户体验。

针对消费者,小冰提供的服务包括小冰聊天机器人、虚拟助手和娱乐解决方案等。小冰的聊天机器人可以协助用户完成各种任务,例如订餐、预约和提供天气预报等。小冰的虚拟助手还可以帮助用户完成打电话、发信息、设置提醒等任务。小冰的娱乐解决方案包括虚拟游戏、音乐推荐和新闻更新。此外,小冰还被集成到智能音箱、家电等多款智能设备中,给消费者提供语音辅助和控制。

小冰希望解决通用框架问题。单点算法可以快速获得很高的市场预期,像人脸识别、语音交互,包括最近很火的AIGC(ChatGPT)等。但小冰认为完备的通用框架才是相对好的商业壁垒。2022年11月,小冰公司完成A+轮融资,用于加速框架的技术研发,希望用通用框架抢占数千亿虚拟人市场。

在客户的需求开发方面,小冰会首先考量场景的通用性。如果说为每个垂直领域提供的解决方案都完全不同,那么这样的商业模型也是不经济、不合理的。基于上述考量,小冰公司的商业化道路走得相当扎实,规模化效应也逐渐显现。根据小冰公司CEO李笛的透露,2021年,小冰公司的客户续约率达到100%,且平均客单价增长了将近两倍。

小冰的商业模式一大优势在于其可扩展性。

作为一家以软件为基础的公司,小冰可快速轻松地将其聊天机器人部署到多个业务和行业,从而实现快速增长和扩张。然而小冰面临的一个潜在挑战是聊天机器人市场的竞争,无论是在中国国内还是在全球范围内。虽然小冰在中国处于领先地位,但它在全球市场面临来自谷歌、微软、亚马逊和 IBM 等其他公司的竞争。

此外,聊天机器人市场仍然相对较新且不断发展(例如近期就遇到了来自微软投资的ChatGPT激烈竞争),这意味着颠覆性技术有可能影响小冰的市场份额。

然而小冰也面临着一些挑战。

最大的挑战之一是确保技术安全并保护用户隐私。随着小冰收集的个人数据越来越多,确保这些数据的安全并尊重用户的隐私非常重要。

小冰面临的另一个挑战是需要在竞争中保持领先。随着市场上 AI 助手和聊天机器人的数量不断增加,小冰必须继续创新并提供新的和改进的功能,以保持竞争力并满足用户不断变化的需求。例如近期ChatGPT的大火都吸引了大部分人的眼球,小冰如何从中脱颖而出是个大的挑战。

 02 

公测自身研发的“ChatGPT”

2023年2月,小冰公司推出小冰链(X-Chain of Thought & Action)的小范围公测。就体验本身而言,小冰链与ChatGPT有所不同。小冰链在用户输入问题后,采用“理解问题-拆分问题-制定步骤-行动-返回结果”的逻辑方式,将得出答案的步骤与信息展示给用户;ChatGPT则是会直接输出用户问题的答案。

根据回答进行分析,小冰链的数据来源是实时且可以追踪,清晰展现思考过程。透明性、实时性的特点打开了大模型的黑盒,让小冰链可以解决大模型训练数据更新不及时的问题;而不同于ChatGPT从训练数据中总结答案。

小冰公司CEO李笛表示,如果把大模型思维链(CoT)这项能力独立出来,使之成为新的控制中枢,这可能是下一个人工智能领域的大事件。

小冰公司,打造国内“ChatGPT”的先驱

小冰链的回答

据小冰公司,区别于ChatGPT的聊天机器人定位,小冰链被定位为下一代行动中枢,即利用大数据模型,通过逻辑思维使小冰链实施分析以及回答。小冰链可以更具弹性地调用任意第三方的大模型,或向下兼容第三方服务,完成搜索、写代码、图像生成、控制智能家居开关等多样的行动。

与ChatGPT相比,小冰链在成本上也具备自身的优势。在降低AI大模型参数规模的同时将逻辑拆分出来,可以减小对算力的依赖,降低训练和线上服务成本,促进AI大模型的普及落地。

据国盛证券报告《ChatGPT 需要多少算力》估算,GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。 ChatGPT每日电费在 5 万美元左右。如果将当前的 ChatGPT 部署到谷歌进行的每次搜索中,需要的资本支出就超过 1000 亿美元。

大型语言模型虽然非常强大,能够帮助人们解决许多事情,但从成本的角度出发,ChatGPT所需的巨大成本并不在各个行业可以接受的范围内,如何降低成本就成为了一个问题,显然小冰正努力将其成本降下来,降低其门槛。

 03 

小冰的AI模型与ChatGPT的对比

鉴于小冰链是新推出的产品,技术上与ChatGPT类似,因此在这不比较小冰链与ChatGPT;而是比较小冰公司过往的AI产品/模型。

小冰的AI模型与ChatGPT的主要区别之一是模型的主要目的。小冰的AI模型被设计为一个对话代理,专注于为用户提供情感支持和陪伴(用于社交媒体和平台的对话式人工智能);相比之下ChatGPT 被设计为一种更通用的大型语言模型,可对范围广泛的输入产生回应以及执行各种自然语言处理任务。

另一个区别是用于开发模型的基础技术,小冰结合使用了基于规则的系统和机器学习技术;而 ChatGPT 则是基于利用海量的互联网数据以及人类反馈强化学习生成响应的Transformer架构。

小冰使用特定的规则集和决策过程进行编程,因此小冰只能使用预定义的响应和模板来生成对话。它对上下文的理解有限,并依赖关键字匹配来确定适当的响应。然而,它的优势在于能够通过自然语言处理(NLP)技术模拟情绪和个性化对话。

ChatGPT经过海量文本数据的训练可以根据该数据的模式和趋势生成响应,可以产生更多样化、更细微的反应。然而,由于ChatGPT依赖于数据中的统计模式,可能会在情商和个性化方面遇到困难。

虽然小冰和 ChatGPT 都是 AI 语言模型,但它们的设计目的不同,各有优缺点。小冰更侧重于客户服务和营销,而ChatGPT则更加通用,可用于语言翻译、文本摘要、内容生成等广泛的应用,侧重于对广泛的输入产生连贯的反应。