テクノロジー ニュース 非公開: アリババのAIボットが読解力テストで人間を上回った

アリババのAIボットが読解力テストで人間を上回った

Alibaba’s AI Bot Outshines Humans in Reading Comprehension Test
Alibaba’s AI Bot Outshines Humans in Reading Comprehension Test

まず、Google の子会社 DeepMind の AlphaGo AI が、自社の対局で世界最高の囲碁プレイヤー を破っ て記録を打ち立てました。その後、カーネギー メロン大学が開発した Libratus という AI がトーナメントでポーカー プロ を上回り 、AI の急速な進歩に世界の注目が集まりました。 AI が人間を上回る最新の例では、アリババが開発したディープ ニューラル ネットワーク モデルが 読解テストで人間よりも 優れた 成績を収めました。

アリババのデータ科学技術研究所が開発した AI モデルは、人間のライバルと争ったコンテストで、機械の言語スキルを評価するための最も信頼できる読解テストの 1 つである SQuAD (スタンフォード質問応答データセット) テストを見事に突破しました。

アリババの AI は、累計 82.44 完全一致 (EM) ポイントを獲得し、スコアボードに 82.304 ポイントを記録した人間の競合他社を上回りました。 同じくアリババが所有する サウスチャイナ・モーニング・ポスト に掲載された報告書によると、この成果は、機械が読解力テストで人間の機械に勝った初の例となる。

Alibaba AI Outshines Humans in Reading Comprehension Test
Alibaba AI Outshines Humans in Reading Comprehension Test

SQuAD 評価の正味 F1 スコアに関しては、 アリババの AI モデルが 88.607 ポイントでトップとなり、マイクロソフトやフェイスブックが開発した同様のシステムよりも上位に位置しました。 言語理解は伝統的に AI システムの弱点とみなされてきたため、この結果は実に印象的です。前述の欠点により、数字を処理したり情報を処理したりするだけでなく、人と真に生産的な会話を行う能力が大幅に制限されます。

アリババの研究部門で自然言語処理の主任科学者を務めるSi Luo氏の言葉によれば、今回の成果は、言語処理能力の向上により、顧客支援業務にAIシステムを導入する新たな道を開くことになるという。

私たちは、基盤となるテクノロジーが顧客サービス、博物館のチュートリアル、患者からの問い合わせに対するオンライン応答などの数多くのアプリケーションに徐々に適用され、前例のない方法で人間の労力を解放できると考えています。

アリババのディープ ニューラル ネットワーク モデルによって達成された結果は、AI システムが、自由に使える膨大な量の情報を処理し、状況に応じて最も正確で正確な答えを返すことによって、「雨の原因は何か」などの客観的な質問に間もなく答えることができるようになるということを示しています。

アリババのAIボットが読解力テストで人間を上回った
アリババのAIボットが読解力テストで人間を上回った
アリババのAIボットが読解力テストで人間を上回った
アリババのAIボットが読解力テストで人間を上回った

「アリババのAIボットが読解力テストで人間を上回った」についてわかりやすく解説!絶対に観るべきベスト2動画

「世界を征服しよう。」AI同士を討論させた結果、衝撃の結末へ
孫氏も唱えたAI→10年後 AGI→さらに10年後 ASI に成る。
Alibaba’s AI Bot Outshines Humans in Reading Comprehension Test
Alibaba’s AI Bot Outshines Humans in Reading Comprehension Test

まず、Google の子会社 DeepMind の AlphaGo AI が、自社の対局で世界最高の囲碁プレイヤー を破っ て記録を打ち立てました。その後、カーネギー メロン大学が開発した Libratus という AI がトーナメントでポーカー プロ を上回り 、AI の急速な進歩に世界の注目が集まりました。 AI が人間を上回る最新の例では、アリババが開発したディープ ニューラル ネットワーク モデルが 読解テストで人間よりも 優れた 成績を収めました。

アリババのデータ科学技術研究所が開発した AI モデルは、人間のライバルと争ったコンテストで、機械の言語スキルを評価するための最も信頼できる読解テストの 1 つである SQuAD (スタンフォード質問応答データセット) テストを見事に突破しました。

アリババの AI は、累計 82.44 完全一致 (EM) ポイントを獲得し、スコアボードに 82.304 ポイントを記録した人間の競合他社を上回りました。 同じくアリババが所有する サウスチャイナ・モーニング・ポスト に掲載された報告書によると、この成果は、機械が読解力テストで人間の機械に勝った初の例となる。

Alibaba AI Outshines Humans in Reading Comprehension Test
Alibaba AI Outshines Humans in Reading Comprehension Test

SQuAD 評価の正味 F1 スコアに関しては、 アリババの AI モデルが 88.607 ポイントでトップとなり、マイクロソフトやフェイスブックが開発した同様のシステムよりも上位に位置しました。 言語理解は伝統的に AI システムの弱点とみなされてきたため、この結果は実に印象的です。前述の欠点により、数字を処理したり情報を処理したりするだけでなく、人と真に生産的な会話を行う能力が大幅に制限されます。

アリババの研究部門で自然言語処理の主任科学者を務めるSi Luo氏の言葉によれば、今回の成果は、言語処理能力の向上により、顧客支援業務にAIシステムを導入する新たな道を開くことになるという。

私たちは、基盤となるテクノロジーが顧客サービス、博物館のチュートリアル、患者からの問い合わせに対するオンライン応答などの数多くのアプリケーションに徐々に適用され、前例のない方法で人間の労力を解放できると考えています。

アリババのディープ ニューラル ネットワーク モデルによって達成された結果は、AI システムが、自由に使える膨大な量の情報を処理し、状況に応じて最も正確で正確な答えを返すことによって、「雨の原因は何か」などの客観的な質問に間もなく答えることができるようになるということを示しています。

アリババのAIボットが読解力テストで人間を上回った
アリババのAIボットが読解力テストで人間を上回った
アリババのAIボットが読解力テストで人間を上回った
アリババのAIボットが読解力テストで人間を上回った

「アリババのAIボットが読解力テストで人間を上回った」についてわかりやすく解説!絶対に観るべきベスト2動画

「世界を征服しよう。」AI同士を討論させた結果、衝撃の結末へ
孫氏も唱えたAI→10年後 AGI→さらに10年後 ASI に成る。