117家!中国大模型最新备案名单和简介汇编

365知识科学分享

2024/04/11 17:20

导读

截止2024年3月,已经有117家“大模型”,成功备案。

4月2日,国家互联网信息办公室公布最新的生成式人工智能备案信息。

截至2024年3月,我国共有117个GenAI完成了备案,包括文心一言、通义千问、kimi、智谱清言、云雀、abab、日日新、星火、盘古以及最新的滴滴出行大模型等。

打开APP,查看更多精彩图片

下面是完整清单列表和我整理的每个大模型的简介,方便大家查询了解。

具体内容如下

1、百度-文心一言

作为科技大厂中首个发布的生成式AI产品,百度“文心一言”于2023年3月16日开启邀测。同年10月,百度发布文心一言最新迭代产品——文心一言4.0。11月1日,百度上线文心一言专业版,单月购买定价为59.9元/月,连续包月优惠价49.9元/月。此前已经向用户开放的文心一言基础版,仍可免费使用。百度CEO李彦宏评价说,文心大模型4.0是迄今为止最强大的文心大模型,实现了基础模型的全面升级,综合能力“与GPT-4相比毫不逊色”。

2、智谱AI-智谱清言

成立于2019年的智谱AI,是国内最早一批研发大模型的企业,由清华大学知识工程实验室(KEG)技术成果转化。当前,智谱已经发布包括双语千亿级超大规模预训练模型GLM-130B,中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品。基于ChatGLM,智谱已于2023年推出To C聊天对话应用“智谱清言”。而在To B层面,智谱也已经与多家国内互联网巨头,政企达成合作。

3、抖音-云雀

2023年8月17日,抖音集团(前字节跳动)宣布开始对外测试AI对话产品“豆包”。据称,“豆包”是字节跳动公司基于云雀模型开发的AI工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页Web平台,iOS以及安卓平台,但iOS需要使用TestFlight安装。

4、百川智能-百川

百川智能成立于2023年,由搜狗创始人王小川创立。经过半年多时间发展,百川智能便接连发布Baichuan-7B/13B,Baichuan2-7B/13B四款开源可免费商用大模型及Baichuan-53B、Baichuan2-53B两款闭源大模型,平均每28天就会发布一款新的大模型。百川智能透露,Baichuan-7B/13B两款开源大模型在多个权威评测榜单均名列前茅,累计下载量超过六百万次。Baichuan2-13B在MMLU、CMMLU、MedQA、USMLE等几大权威评估基准中领先LLaMA2。

5、中科院自动化研究所-紫东太初

中科院自动化研究所成立于1956年10月,是中国最早成立的国立自动化研究机构。“紫东太初”定位为跨模态通用人工智能平台,于2021年正式发布。目前,“紫东太初”参数已达千亿级别,拥有视觉、文本、语音多种模态,基于全栈国产化基础软硬件平台建立。今年6月,紫东太初发布2.0版本,再加入了视频、传感信号、3D点云等新的模态数据。目前,紫东太初已在文本创作、医疗、物流、政务等多个行业实现应用落地。

6、Minimax-ABAB

Minimax自研了文本到视觉(text-to-visual)、文本到语音(text-to-audio)、文本到文本(text-to-text)三个模态的基础模型架构,推出自研通用大模型“ABAB”。

7、商汤科技-日日新

2023年4月,商汤推出日日新SenseNova”大模型。据悉,日日新大模型拥有提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种能力,其中还包括商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等功能强大且易用的内容生成平台产品。目前,商汤最新版大模型“商量SenseChat 2.0版本”已发布,其参数达千亿级规模。

8、上海人工智能实验室-书生

自2021年发布后,“书生”(INTERN)大模型历经数次升级,从国内首个覆盖多种视觉任务的通用大模型,逐步升级为涵括视觉、语言和三维等在内的大模型体系。除书生·天际外,书生还推出了书生·多模态、书生·浦语,并且提供了首个面向大模型研发与应用的全链条开源体系。

9、科大讯飞-星火认知大模型

科大讯飞推出的星火认知大模型是一款新一代的认知智能大模型,它具备跨领域的知识和语言理解能力。这款大模型能够通过自然对话的方式来理解并执行任务,提供了包括语言理解、知识问答、逻辑推理、解答数学题、代码理解与编写等多种能力

10、三六零-360智脑大模型

360智脑大模型是由360集团开发的认知型通用大模型,最新版本为“360智脑4.0”。这款大模型已经接入了360集团旗下的各种产品中。360智脑大模型旨在提供优秀的文本生成和创作服务,支持文本或图片输入生成高质量、多风格的图像。此外,它还具备强大的智能编辑功能,能够轻松实现无损放大、智能消除和智能抠图等,帮助用户快速创作出精美的图片。

11、阿里巴巴-通义千问大模型

通义千问是阿里云自研的底层通用大模型,旨在理解和生成人类语言,成为用户在生活和工作中的智能助手。该模型自4月份正式亮相以来,已经推出了2.0版本,参数达到了千亿级别,强化了其在多个领域的应用能力。在最新的云栖大会上,阿里云宣布通义千问2.0的发布,并同时在各大手机应用市场上线了通义千问APP,进一步扩展了其应用范围。

12、腾讯-腾讯混元助手大模型

腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。

13、华为-华为云盘古NLP大模型

华为云的盘古NLP大模型是业界首个超千亿参数的中文预训练大模型,包含在华为云盘古系列超大规模预训练模型中。该模型结合了海量的图像、视频数据和盘古独特技术,构建了视觉基础模型、多模态大模型以及预测大模型,能够实现图像生成、理解、视频生成等功能。它通过融合语言和视觉的跨模态信息,加强了模型的多任务能力,使得不同任务间具备强大的迁移能力。

此外,华为云在4月25日发布了包括30亿参数的全球最大视觉预训练模型和与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的全球最大中文语言预训练模型。这些模型的开发标志着华为云在工业化AI开发新模式方面的新进展,旨在提升AI的应用效率和效果。

14、华为-智慧助手(小艺)大模型

华为的智慧助手小艺升级版是基于华为盘古L0基座大模型构建的,专门针对终端消费者场景进行了大量的场景数据与精调模型后的L1层对话模型优化。这个全新版本的小艺在华为开发者大会上正式亮相,展示了其更加聪明、能干和贴心的特点。小艺现在能提供更智能的交互体验,例如,根据用户需求自动生成文案等内容。

15、出门问问-序列猴子

出门问问近期发布了自研的大型语言模型「序列猴子」,并在其“AGI·降临”2023 AIGC战略发布会上正式亮相。这款大模型的开发旨在主要服务B端企业,为企业提供专属的模型服务。序列猴子支持智能多轮对话,能够帮助提高对话管理和调度能力,快速响应用户反馈和需求,提高对话的效率和精准度。

这款大模型是一个超大规模语言模型,具有长序列、多模态、单模型、大数据等特点。基于其通用的表示与推理能力,序列猴子支持多轮交互,能够大幅度提高生产效率和数据处理能力,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。

16、月之暗面-Moonshot

月之暗面 (Moonshot AI) 创立于2023年3月,致力于寻求将能源转化为智能的最优解,通过产品与用户共创智能,2023年10月推出全球首个支持输入20万汉字的智能助手产品Kimi。创始团队核心成员参与了 Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。

17、昆仑万维-“天工”大模型

昆仑万维的天工大模型是国内首个对标ChatGPT的双千亿级大语言模型,也是一个对话式AI助手。天工通过自然语言与用户进行问答交互,AI生成能力可满足文案创作、知识问答、逻辑推演、数理推算、代码编程等多元化需求。支持1万字以上文本对话,实现20轮次以上用户交互,在学习、职场、生活等多类问答场景中表现出色。

18、金山-WPS AI

北京金山软件有限公司推出的WPS AI是一个集成在WPS Office套件中的人工智能应用,旨在为用户提供更智能、高效的文档处理解决方案。它利用大语言模型能力,支持智能文档写作、阅读理解和问答、智能人机交互等功能,以此来提升用户在办公、写作、文档处理等方面的体验。WPS AI将与WPS的其他产品无缝衔接,使用户能够在一个统一的平台上享受到AI增强的办公工具。

此外,WPS AI不仅仅是一个简单的办公助手,它还是一个内容创作工具,能够帮助用户节省时间和精力。通过WPS AI,用户可以改进内容、根据需要修改内容,并利用其内置工具享受到AI带来的种种好处。

19、奇虎-奇元大模型

北京奇虎360科技有限公司近日发布了奇元大模型,这是360公司自研的又一大型模型。奇元大模型已于11月4日通过备案,并且360公司因此成为国内首家两个大模型(包括此前的360智脑大模型)均通过备案的科技企业。奇元大模型的商业化和产品定位主要面向B端用户,预计将聚焦更多商业化应用。

据了解,奇元大模型的技术优势在于360长期深耕的人工智能核心技术,其数据优势基于搜索所拥有的大规模、多样性和高质量训练语料。这为奇元大模型提供了搜索增强的优势,使其在提供生成创作、多轮对话、逻辑推理等核心能力方面表现出色,能够覆盖大模型的全部应用场景。

20、面壁智能-面壁露卡LUCA

面壁智能发布的面壁露卡LUCA是一个千亿多模态大模型,于2023年8月28日在“通用人工智能算力论坛”(AGICF)上重磅发布。这款大模型是基于CPM-Bee作为基座模型,对标ChatGPT的多模态智能对话助手。面壁露卡LUCA 1.0版本最早于5月27日在2023数博会上首次亮相,展示了其语言模型的强大能力。LUCA通过自然语言处理技术,能够实现智能多轮对话,提高对话管理和调度的效率和精准度,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域 。

21、三快-美团大模型“通慧”

22、网易有道-子曰

网易有道推出了教育行业的大模型「子曰」,这是国内首个专注于教育领域的垂直大模型。于2023年7月26日,网易有道在“powered by 子曰”教育大模型应用成果发布会上宣布了这一重大成就。「子曰」大模型发布了六大创新应用,包括“LLM翻译”、“虚拟人口语教练”、“AI作文指导”、“语法精讲”、“AI Box”以及“文档问答”,旨在通过AI技术提升教育质量和效率。

23、世纪好未来教育-好未来MathGPT大模型

好未来推出的MathGPT大模型是面向全球数学爱好者和科研机构的数学垂直领域大模型,特别注重解题和讲题算法。这是国内首个专为数学领域打造的大模型,覆盖了中小学数学题的多个类型,如计算题、应用题和代数题等。

24、智者天下-知海图AI

知乎和面壁科技合作推出的「知海图AI」是一个中文大模型,已于2023年4月14日开始内测。据介绍,在特定场景中,「知海图AI」的性能与GPT-4相当。这标志着知乎在人工智能领域的又一大步进展,旨在通过强大的AI能力提升用户体验和内容质量。知乎通过这种合作,进一步扩展了其在AI技术应用上的探索和实践,特别是在处理和理解中文内容方面。

25、蚂蚁金服-AntGLM

蚂蚁集团发布了工业级金融大模型AntFinGLM,并开放了金融专属任务评测集「Fin-Eval」。这个大模型通过综合评估金融专属任务的能力,展现了在金融领域的专业力、知识力、语言力以及安全力,能够在诸如「研判观点提取」、「金融意图理解」和「金融事件推理」等任务上达到专家水平。

26、极目未来-银河大模型

27、维沃移动-vivo蓝心大模型

vivo推出了自研的通用AI大模型矩阵——蓝心大模型,旨在全面提升智能手机的应用和服务能力。蓝心大模型包含了不同参数量级的模型,涵盖了十亿、百亿、千亿三个参数量级,共计五款模型。这些模型旨在满足不同应用需求和算力条件,通过在手机终端和云端的协同工作,以优化性能和用户体验。

28、网易-网易邮箱智能助手大模型

网易邮箱智能助手是网易邮箱团队开发的一款基于大语言模型技术的应用,旨在提高用户处理邮件的效率和体验。这款智能助手已正式通过相关备案,对公众开放。

29、元象-元象XVERSE大模型

元象科技推出的XVERSE大模型系列,包括XVERSE-Long-256K和XVERSE-65B,展示了在人工智能大模型领域的领先技术和创新应用。XVERSE-Long-256K是全球首个上下文窗口长度达到256K的开源大模型,支持输入高达25万汉字,开创了大模型应用的“长文本时代”。该模型通过技术创新,实现了无损长程注意力机制,有效平衡了长文本下的关注内容准确性和推理速度,并且免费开源供商用。

30、朗玛-39AI全科医生

朗玛信息技术股份有限公司最近发布了“朗玛·39AI全科医生”,这是一个集成了大量医学数据和健康科普数据的医疗健康人工智能产品。它的目标是像一名专家医生一样,提供更好、更全面、更准确的医学解答。该产品将主要应用于基层医疗卫生机构,旨在帮助医务人员开展临床辅助诊断服务,并提供健康咨询和管理等服务,从而提升医务人员的诊疗水平和为民众提供全生命周期的健康管理咨询服务。

31、虎博-TigerBot

虎博科技发布了自研的多模态大模型TigerBot,这是一个多语言多任务的大规模语言模型,特别注重开源,旨在推动AI技术的广泛应用和发展。TigerBot的研发历经3个月的密集开发和超过3000次的实验迭代,展现了内容生成、开放问答、信息提取等多方面能力,如辅助创作营销文案、进行长文本总结和理解等。此外,TigerBot也支持图片生成,实现了文生图的能力。

32、星环-无涯(Infinity)

"无涯"是一款针对金融量化领域的超大规模参数的生成式大语言模型,使用了上百万的专业金融语料进行二次预训练,具备了对金融通识领域准确理解的能力。它能够处理包括政策和研报分析、新闻解读、事件总结等在内的多种金融量化问题,以及生成另类的策略因子集合。

33、任意门-SoulX

上海任意门科技有限公司最近推出了一款名为“SoulX”的自研大模型,这标志着公司在AIGC(人工智能生成内容)与社交场景的深度融合方面迈出了重要一步。SoulX作为生成式人工智能的核心工具,将在Soul平台的“AIGC+社交”布局中扮演关键角色,旨在垂直应用于平台上的多元社交互动场景,如智能对话机器人、AI辅助聊天、虚拟陪伴等,进一步丰富用户的社交体验。

展开全文
文章关键词
#人工智能 #百度 #书生

大家都在聊

热门评论

相关推荐

热门视频

查看更多视频

热点搜索

打开APP 追踪24小时热点新闻
打开APP 追踪24小时热点新闻