2023年10月31日、ソフトバンク株式会社は国内最大級の生成AI開発向け計算基盤の稼働をスタートし、日本語に特化した国産大規模言語モデル(LLM)の開発に着手したことを発表しました。LLMの構築は2024年内の予定だそうです。
その翌日には、NTTが世界トップレベルの日本語処理性能を持つ大規模言語モデル「tsuzumi」を活用した商用サービスを、2024年3月から提供開始すると発表。大手通信会社による国産生成AIサービスの開発競争が過熱しています。
2022年のOpenAI社によるChat GPT「GPT-3.5」公開を皮切りに、生成AIが世界中に大きなインパクトを与えました。
しかし現在、生成AIの大規模投資は海外企業を中心に行われており、日本語以外の言語のデータセットに基づいた開発が先行しています。生成AIのサービス開発における最大の課題は、インターネットなどにある大量のデータの関連性を学習するために必要なエネルギー量や運用コストが膨大で、環境的・経済的な負担が大きいことです。
この現状をふまえて、NTTとソフトバンクはそれぞれに日本語データセットの活用やLLMの軽量化といった新機軸を打ち出し、Chat GPTなど先行する生成AIサービスと差別化を図ろうとしています。
ソフトバンクが開発を進めているのは、日本語に特化した高品質かつ安心・安全な国産LLMです。LLMの性能を示すパラメーター数は、OpenAI社のGPT-3.5にも匹敵する国内最大級の3500億。独自の日本語データセットを活用することで、日本の文化・商習慣に適した生成AIソリューションの提供をめざしています。
対してNTTが開発する大規模言語モデル「tsuzumi」の特徴は、世界トップレベルの日本語処理性能と軽量性の両立です。
LLMのパラメーター数は軽量版が70億、超軽量版が6億と、GPT-3の1750億パラメーターに比べて1/25〜1/300程度。これによって消費電力を抑え、推論コストをGPT-3の1/20〜1/70、学習コストを1/25〜1/300まで低減し、環境的・経済的な負荷という生成AIの課題を解決しようとしています。
加えて、NTTが蓄積する自然言語処理研究の知見によってチューニングの柔軟性を強化。医療・金融などの業界・業種に特化した知識を効率的に学ばせれば、少ないパラメーター数でも高度な処理性能を実現することができます。
それぞれに新機軸を打ち出して、Chat GPTをはじめとする既存サービスとの差別化を狙うNTTとソフトバンク。2024年の両社のサービスリリースに伴い、国内の生成AI市場はさらに活性化するでしょう。
金融、通信、製造、自動車などさまざまな業界に対して独自のサービスを提供しているソルクシーズグループも、生成AIを導入したサービスを展開していく予定です。
専門性が高く独自の情報やノウハウがある企業は、著作権侵害やフェイクニュースの拡散などのリスクがない生成AIサービスを開発することができます。ソルクシーズグループならではの知見を活かした高品質のサービスをリリースする際には、このブログでも紹介していきますので、ぜひご注目ください。