ABEJA和NEDO公開徵集的 “後5G信息通信系統基礎設施增強研究與開發項目/後5G信息通信系統開發” 通過了法學碩士開發項目計劃

Abeja · 02/01 23:00

人とAIの協調により「ゆたかな世界を、実装する」株式会社ABEJA（本社：東京都港区、代表取締役CEO：岡田陽介、以下「ABEJA」）は、国立研究開発法人新エネルギー・産業技術総合開発機構（以下「NEDO」）が公募した「ポスト5G情報通信システム基盤強化研究開発事業※1／ポスト5G情報通信システムの開発」に当社提案の「LLM※2の社会実装に向けた特化型モデルの元となる汎化的LLM」が採択されましたことをお知らせいたします。

ABEJAは、主にLLMの構築に必要となる計算リソースについて、7億円規模の助成金の交付を受ける予定です。

ABEJAは、LLMの社会実装に必要不可欠となる精度および計算コストパフォーマンスの飛躍的な向上を目的に、日本語LLMおよび周辺技術（RAG※3、Agent※4）の研究開発を行います。

また、LLMの利活用の推進や社会全体におけるAI技術革新の加速、次世代の研究者や技術者の育成に貢献できるよう、開発したLLMおよびソースコードや開発ノウハウなどを適宜公開してまいります。

なお、当社の事業化においては、デジタル版EMS「ABEJA Platform」に2023年より搭載している「ABEJA LLM Series」と合わせ、広く提供を行う予定です。ビジネスモデルは、オープンソースソフトウェア(OSS)※5におけるディストリビューションモデル※6を想定しており、公開するLLMの利活用に伴い必要となるサポートを有償で提供する予定です。

ABEJAは、2018年より生成AIの一つであるLLMにおける研究開発を進め、2023年3月以降は、「ABEJA LLM Series」をABEJA Platformに搭載し、顧客企業に提供してまいりました。現在は、顧客企業のLLMの実装を実現すべく、サポート領域をより広範囲に拡大し、戦略策定やビジネスプロセスの構築、ビジネスプロセス上での運用まで、一気通貫で顧客支援を担うとともに、更なるサービスの拡充を図り、LLMの研究開発を継続して進めております。

ABEJAはこのたびの採択を受け、当該事業は、当社の経営理念である「ゆたかな世界を、実装する」を実現する上でも意義のある取り組みであり、社会全体におけるLLMの実装を加速させる一助を担うと考えております。

現在、世界中の企業がLLMを中心とする生成AIから生み出される巨大な価値の享受を目指し、様々な取り組みを開始しています。実際、LLMの市場規模は急速な拡大が見込まれており、日本での対話AIビジネスの市場規模は楽観的なシナリオで2023年度の140億円から2027年度には6,905億円（年間平均成長率165.0％、CAGR：2023年度-2027年度）に成長すると予想されており（出所：株式会社シード・プランニング「2023年版対話AIビジネスの現状と将来展望」）、ABEJAにおいてもベースシナリオとして2,000億円規模の市場を見込んでおります。

LLMの利活用により産業構造に大きな変革が生じることが期待されている一方、現状では、LLMの利用時に大規模な計算リソースの消費が不可避となるため、投資対効果を勘案すると適用範囲に制約が生じ、LLMの社会実装の妨げの一因となっています。また、LLMが抱える課題の代表的なものとして、最新の情報や更新された情報に対応しない「知識のカットオフ」や、事実に基づかない不正確な情報を生成する「ハルシネーション」があります。これは、LLMの知識が膨大な量の「既存の」データに基づいており、「学習データに存在する不備や誤情報も学習する」というLLM特有の性質に基づくものです。LLMの精度向上には、誤った情報や偏った情報を含むデータを排除し、正確で信頼性の高いデータを学習させることが必要不可欠です。対処手法として、学習済のLLMに新たなデータセットを用いて追加学習させる「fine-tuning」がありますが、都度大規模な計算リソースを消費し、コストや時間がかかります。このため、一部のエンタープライズ企業の適用に限られているのが実情です。2023年にOpenAIが、「GPT-3.5 Turbo」のfine-tuning機能を発表しましたが、対応可能なデータ量は4,096トークン、50MB以下のファイルに限定されており、実用性に課題があります。

こうした現状の課題解決に有望視されている手法に、「RAG（Retrieval-Augmented Generation）」があります。RAGは、LLMと外部のデータベースや情報源（以下「外部データ」）を結びつけ、LLMが外部データの知見を組み込んだ回答を生成できる技術です。fine-tuningを都度行うことなく、外部データを入れ替えるだけで、外部データに関連する高精度な回答を行うことが可能となります。また、「Agent」の最適化を行うことで、入力された内容を基にLLMが自律的にAPIやツール活用など必要なアクションを計画・実行できるようになります。

ABEJAは、RAGによる精度の向上およびAgentの最適化が、計算コストパフォーマンスを向上させ、経済的合理性や適用範囲の拡張性をもたらし、LLMの社会実装を強力に推進すると考えております。現在用いられるRAGには、技術進歩の余地があると捉えており、LLMおよび周辺技術（RAG、Agent）の研究開発に統合的に取り組むことで、実用性の高い先駆的な手法を実現してまいります。なお、LLM単体の研究開発においては、オープンソースの既存LLMをベンチマークとし、公開時にJGLUE※7の全項目で、トップスコアを達成することを目標としています。

ABEJAは、今後、日本が国際的なAI分野において重要な役割を担い、国際社会における情報処理技術の新たなスタンダードの確立をすることを視野にいれております。

ABEJAは、生成AIを利活用する企業や組織の増加、社会におけるAI技術革新の大幅な加速、そして次世代の研究者や技術者の育成を目的に、研究開発で得られたLLMおよびソースコードや開発ノウハウなどを社会に提供することでLLMの社会実装を推進し、ABEJAの企業理念である「ゆたかな世界を、実装する」の実現に努めてまいります。

事業概要

公募事業名	ポスト5G情報通信システム基盤強化研究開発事業／ポスト5G情報通信システムの開発
当社応募事業名	LLMの社会実装に向けた特化型モデルの元となる汎化的LLMに関する研究開発
実施期間	2024年2月～2024年8月
目　的	・LLMの社会実装に向け、汎用的な活用を見据えた日本語LLMと周辺技術（RAG、Agent）の研究開発・研究開発で得られた成果物（LLM、ソースコード、開発ノウハウなど）を公開し、生成AIの利活用、社会におけるAI技術革新の加速、次世代の研究者や技術者の育成を推進する・国際的なAI分野において、日本が重要な役割を担い、国際社会における情報処理技術の新たなスタンダードを確立する
概　要	・特化型の元となる汎化的なLLMの研究開発 - オープンソースのLLMをベンチマークとし、評価でトップスコアを達成 - 周辺技術（RAG、Agent）の精度を向上し、データ活用を推進・社会実装に向け、自社ビジネスに関連させた展開を図り、一部モデル・ノウハウ等の成果物も公開・提供 - 研究開発したLLMと周辺技術（RAG、Agent）を、現在提供しているサービスと合わせて広く提供 - 研究開発で得られた成果物（ソースコード・モデル・開発ノウハウ）を公開
NEDO公表内容	採択結果公表ページ URL：https://www.nedo.go.jp/koubo/IT3_100304.html

■ 全体概要図（イメージ）

■ 実施スケジュール

用語について

※	用　語	内　容
1	ポスト5G情報通信システム基盤強化研究開発事業	日本国内におけるポスト5G情報通信システムの開発・製造基盤強化を目指し、中核となる技術を開発する事業。ポスト5G情報通信システムとは、第5世代移動通信システム（5G）より更に超低遅延や多数同時接続といった機能が強化されたポスト5Gに対応した通信システムを指す。https://www.meti.go.jp/policy/mono_info_service/joho/post5g/index.html
2	LLM	Large Language Modelの略称で、生成AIの領域の一つである大規模言語モデル。
3	RAG	Retrieval-Augmented Generationの略称。外部のデータベースや情報源を結びつける技術。この技術の活用により、LLMが外部のデータベースや情報源の知見を組み込んだ精度の高い回答を生成できるようになる。
4	Agent	Agentは、自律的なアクションを計画・実行できるようにする技術。この技術を用いることで、LLMが自律的に意思決定をして、入力された内容を基にAPIやツールの活用などのアクションを計画し実行できるようになる。これにより、自律的に学習データに含まれていない外部データを用いた回答を作成することが可能になる。
5	オープンソースソフトウェア(OSS)	利用者の目的を問わず、無償でソースコードを使用、調査、再利用、修正、拡張、再配布が可能なソフトウェアの総称。
6	ディストリビューションモデル	OSSの提供会社または他のコミュニティで開発した、OSSを組み込んだモデルに必要になる保守やバグ、セキュリティなどアップデートに関するサポートを行うビジネスモデル。ABEJAは、このたびの事業化において「Red Hat Enterprise Linux(RHEL)]の手法を想定。
7	JGLUE	日本語の一般的な言語理解能力を測るためのデータセット群。LLMモデルを様々な観点から評価する。

■ 株式会社ABEJAについて

ABEJAは、「ゆたかな世界を、実装する」を経営理念とし、「ABEJA Platform」を基盤に顧客企業の基幹業務のプロセスを変革し、ビジネスの継続的な収益成長の実現に伴走する「デジタルプラットフォーム事業」を展開しています。2012年の創業時よりABEJA Platformの研究開発を進めており、これまで多種多様な業界・業態の300社以上のデジタル変革をABEJA Platform上で実現してきました。また、「Human In the Loop」をはじめとする高度なノウハウやアプローチを用いて、デジタル変革に必要不可欠な「人とAIの協調」を実現し、戦略的かつ効率的に顧客の基幹業務を変革し、さらにはビジネスモデルの革新に取り組んでいます。

本社：東京都港区三田一丁目1番14号 Bizflex麻布十番2階

設立：2012年9月10日

代表者：代表取締役CEO 岡田陽介

事業：デジタルプラットフォーム事業

URL：https://abejainc.com

株式會社ABEJA（總部：東京都港區；代表董事兼首席執行官：岡田洋介；以下簡稱 “ABEJA”）是由國家研究與開發公司新能源和工業技術開發組織（以下簡稱 “NEDO”）提出的 “後5G信息通信系統基礎設施增強研發項目*1/後5G信息通信系統開發”（以下簡稱 “NEDO”）通過人類與人工智能的合作 “實現一個富裕的世界” 很高興地宣佈，“LLM” 已被選中。

ABEJA計劃獲得7億日元的補助金，主要用於建造法學碩士所需的計算資源。

ABEJA進行日本法學碩士和外圍技術（RAG*3，Agent*4）的研究和開發，目的是顯著提高準確性和計算成本效益，這對於LLM的社會實施至關重要。

此外，我們將酌情披露已開發的LLM、源代碼、開發知識等，以便我們可以促進LLM的利用，加速整個社會的人工智能技術創新，併爲下一代研究人員和工程師的發展做出貢獻。

此外，在我們的商業化過程中，我們計劃將其與 “ABEJA LLM系列” 一起廣泛提供，後者自2023年以來已安裝在數字EMS “ABEJA平台” 上。該商業模式假設開源軟件 (OSS) *5 採用分發模式*6，並計劃爲即將發佈的 LLM 的使用提供必要的收費支持。

自2018年以來，ABEJA一直在推動LLM（一種生成式人工智能）的研發，自2023/3年起，“ABEJA LLM系列” 已安裝在ABEJA平台上並提供給客戶公司。目前，爲了實現對客戶公司的LLM的實施，我們已將支持範圍擴大到更廣泛的範圍，並負責通過戰略制定、業務流程構建和業務流程中的運營一直爲客戶提供支持，我們正在努力進一步擴展我們的服務，繼續推進LLM的研發。

ABEJA最近已被採用，我們認爲該項目是實現我們 “實現富裕世界” 管理理念的一項有意義的舉措，將有助於加快LLM在整個社會的實施。

當前，世界各地的公司正在啓動各種舉措，目的是享受以LLM爲中心的生成式人工智能所產生的巨大價值。實際上，在樂觀的情景下，LLM的市場規模預計將迅速擴大，日本對話人工智能業務的市場規模預計將從2023財年的140億日元增長到6905億日元（平均年增長率165.0％，複合年增長率：2023-2027年）（資料來源：種子規劃有限公司 “2023年對話人工智能業務的現狀和未來前景”），同時也是基於ABEJA的預測假設市場規模爲2000億日元。

儘管預計LLM的利用將導致產業結構發生重大變化，但目前，使用LLM時大規模計算資源的消耗是不可避免的，因此，考慮到投資回報率，就會對應用範圍進行限制，這是阻礙LLM社會實施的原因之一。此外，LLM 面臨的典型問題是無法響應最新信息或更新信息的 “知識截止”，以及 “halcination”，後者生成不基於事實的不準確信息。這是因爲LLM知識基於大量的 “現有” 數據，它基於LLM的獨特特性，即 “甚至學習數據中存在的不完整性和錯誤信息”。爲了提高LLM的準確性，必須消除包含不正確或有偏見信息的數據，並學習準確可靠的數據。作爲一種應對方法，有 “微調”，即使用已經學習的LLM的新數據集進行額外的學習，但是每次都會消耗大量的計算資源，這既昂貴又耗時。出於這個原因，現實情況是它僅限於某些企業公司的應用程序。OpenAI在2023年宣佈了 “GPT-3.5 Turbo” 的微調功能，但是可以處理的數據量僅限於4,096個令牌和50 MB以下的文件，因此在實用性方面存在問題。

“RAG（檢索增強生成）” 是一種被視爲有望解決當前此類問題的方法。RAG是一種將LLM與外部數據庫和信息源（以下簡稱 “外部數據”）聯繫起來的技術，並允許LLM結合外部數據中的知識生成答案。只需替換外部數據，無需每次都進行微調，就可以執行與外部數據相關的高精度答案。此外，通過優化 “代理”，LLM將能夠根據輸入內容自主計劃和執行必要的操作，例如使用API和工具。

ABEJA認爲，通過RAG和優化代理提高準確性將提高計算成本性能，帶來經濟合理性和應用範圍的可擴展性，並有力地促進LLM的社會實施。我們認爲，目前正在使用的RAG還有技術進步的空間，我們將通過整合LLM和外圍技術（RAG，Agent）的研究和開發，實現具有高度實用性的開創性方法。請注意，在LLM獨立研發中，現有的開源LLM用作基準，目標是在發佈時在所有JGLUE*7項目中獲得最高分。

ABEJA正在考慮日本未來將在國際人工智能領域發揮重要作用，並在國際社會中建立信息處理技術的新標準。

ABEJA通過向社會提供通過研發獲得的LLM、源代碼、開發知識等，促進LLM的社會實施，其目的是增加使用生成式人工智能的公司和組織的數量，大幅加速社會中的AI技術創新，培養下一代研究人員和工程師，並努力實現ABEJA的企業理念 “實現一個寬敞的世界”。

業務概述

公開發行企業名稱	後5G信息通信系統基礎設施提升研究與開發項目/後5G信息通信系統開發
我們申請的企業名稱	研究和開發廣義法學碩士作爲社會實施法學專業模型的基礎
實施期	2024/2 到 2024/8
目的	・研究開發日本法學碩士及周邊技術（RAG、Agent），着眼於LLM的社會實施的通用用途・披露通過研發獲得的可交付成果（LLM、源代碼、開發知識等），促進生成式人工智能的利用，加速社會人工智能技術創新，培養下一代研究人員和工程師・日本將在國際人工智能領域發揮重要作用，並在國際社會建立信息處理技術的新標準
概述	・作爲專業化源泉的廣義法學碩士研究與開發 -使用開源 LLM 作爲基準在評估中獲得最高分 -提高外圍技術（RAG、Agent）的準確性並提高數據利用率・在社會實施方面，我們的目標是與自己的業務相關的發展，同時披露和提供一些模型和專有技術等可交付成果 -我們提供我們研究和開發的各種法學碩士和外圍技術（RAG、Agent）以及我們目前提供的服務 -發佈通過研發獲得的可交付成果（源代碼、模型、開發專有技術）
NEDO 出版物詳情	收養結果發佈頁面網址：https://www.nedo.go.jp/koubo/IT3_100304.html

■ 總體概述圖（圖片）

■ 實施時間表

關於條款

※	條款	內容
1	後5G信息通信系統基礎設施增強研發項目	一家開發核心技術的企業，旨在加強日本國內後5G信息通信系統的開發和製造基礎設施。後5G信息通信系統表示與後5G兼容的通信系統，與第五代移動通信系統（5G）相比，具有進一步增強的功能，例如超低延遲和多個同步連接。https://www.meti.go.jp/policy/mono_info_service/joho/post5g/index.html
2	哈哈	它是大型語言模型的縮寫，大規模語言模型是生成式人工智能的領域之一。
3	抹布	檢索增強生成的縮寫。連接外部數據庫和信息源的技術。通過利用這項技術，LLM將能夠根據來自外部數據庫和信息來源的知識生成高度準確的響應。
4	代理人	代理是一種使計劃和執行自主行動成爲可能的技術。通過使用這項技術，LLM可以自主做出決策，計劃和執行行動，例如根據輸入的內容使用API和工具。因此，可以使用學習數據中未包含的外部數據自主創建答案。
5	開源軟件 (OSS)	一個通用術語，指無論用戶的目的如何，都可以免費使用、研究、重用、修改、擴展和重新分發源代碼的軟件。
6	分發模型	由 OSS 提供商或其他社區開發的一種商業模式，提供與包含 OSS 的模型所需的維護、錯誤、安全和其他更新相關的支持。ABEJA假設這種商業化採用 “紅帽企業 Linux（RHEL）] 方法。
7	JGLUE	一組用於衡量日語一般語言理解能力的數據集。LLM 模型是從不同的角度進行評估的。

■ 關於株式會社ABEJA

ABEJA的管理理念是 “實現一個寬敞的世界”，並且正在開發 “數字平台業務”，該業務將基於 “ABEJA平台” 改變客戶公司的核心業務流程，並繼續實現業務利潤增長。自2012年成立以來，我們一直在促進ABEJA平台的研發，到目前爲止，我們已經在ABEJA平台上爲不同行業和業務類別的300多家公司實現了數字化轉型。此外，利用 “Human In the Loop” 等先進的專業知識和方法，我們實現了 “Human AI 協調”，這對於數字化轉型至關重要，可以從戰略上高效地轉變核心客戶運營，並且還在努力創新商業模式。

總部：東京都港區三田1-14 Bizflex 麻布十番二樓

成立時間：2012/9/10

代表：代表董事兼首席執行官岡田洋介

業務：數字平台業務

網址：https://abejainc.com

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

ABEJA、NEDOが公募した「ポスト5G情報通信システム基盤強化研究開発事業／ポスト5G情報通信システムの開発」に、LLM開発事業案が採択

ABEJA和NEDO公開徵集的 “後5G信息通信系統基礎設施增強研究與開發項目/後5G信息通信系統開發” 通過了法學碩士開發項目計劃

風險及免責聲明

聲明