ソフトウェア史上初めて、企業は 真に インテリジェントなアプリケーションを構築できるようになりました。
そして一番いいところは?
変化を主導するいくつかの AI プラットフォームのおかげで、このインテリジェンスを利用することは API にアクセスすることと何ら変わりません。ビジネスであれば、これらのサービスが提供する可能性を無視することはできません。
2010 年から 2020 年にかけて、私たちは人工知能 (AI) の時代に正式に突入しました。ほとんどの人は周りを見回して「あれ、何か見逃したかな?」と言っています。なぜなら、これはAIの「伝道者」や大衆文化が広めてきた誇大宣伝とはまったく似ていないからだ。全滅させる巨大なメタルイカの軍隊も、人間のような知性を駆使してプレイするマインドゲームもありません。
しかし、テクノロジーが常にそうであるように、AI は私たちの周囲のほぼすべてのものに静かに侵入してきました。そして、この魔法のように見えるテクノロジーは、それ自体では、少なくとも人間の感覚ではおそらく知性がありませんが、正しく応用すれば、ほとんど魔法のような結果を生み出します。 AI は、平均的な人の生活を変えるものは何もないかもしれません (大なり小なり、日々の改善が行われるだけです)。ビジネスにとって、創造性、スピード、成長などの無限の可能性を秘めています。
顔認識、物体認識、音声認識などのテクノロジーは、非常に優れた顧客エクスペリエンスと、競合他社に対するほぼ不公平な優位性を約束します。あらゆる企業が AI 部門を設立するか、これらの方針に沿って考えているのも不思議ではありません。ありがたいことに、大勢の博士号取得者を雇う必要はありません。 人工知能 (より正確には機械学習) は、いくつかの大手企業だけでなくニッチ企業も AI サービスを古き良き REST API として提供するまでに成熟しました。
合計数ドル、場合によっては無料で、これらのサービスを評価し、ビジネス ライフサイクルに確かな価値提案を提供するかどうかを確認できます。
はい、サービスを完成させて運用環境で使用し始めたら、毎月の請求額に厳密に注意する必要があります。 AI/ML は本質的に、非常に強力なサーバーの分散セット (主にグラフィックス カードに搭載されているプロセッサ チップを使用します) 上で大量のデータを処理することです。当然のことながら、大規模なデータと大規模なコンピューティングを扱うには、より多くのコストがかかります。
誤解しないでください。
私の目的は、これらの企業を否定することでもなく、誰かが AI の分野に足を踏み入れることを妨げることでもありません。これらの企業には、料金プランが詳細にリストされています (またはリクエストに応じて提供されます)。これを超えると、彼らはあまり何もできません。したがって、使用状況が監視されなくなると (さらに悪いことに、自動化されたシステムに、たとえばサーバーの RAM がいっぱいになるバグがあり、この「負荷」を処理するために作成されるすべての新しいマシンでそのバグが複製され続けると)、次のような負担がかかります。電気代はお客様のご負担となります。
ソリューション?
ああ、それはかなり単純です。大多数のサービス プロバイダーには、アラートのしきい値として機能する金額 (たとえば、月額 500 ドル) を指定できるアラート システムがあります。したがって、1 か月の使用量が 500 ドルを超えるとすぐに、システムは通知セクションに記載されているすべての人に電子メール、テキスト メッセージ、その他を送信します。このようなパニックを見逃すのは難しいでしょう。 😄 それで、その日のレッスンは何ですか?この金融アラート システムは、最初に知っておくべきことの 1 つです。また、これは最初にセットアップしてテストするものの 1 つである必要があり、場合によっては 最初 に行うこともあります。私を信じて;いつか私にアドバイスに感謝するでしょう。
よし、もういい、おしゃべり!続いて、私が印象的だと感じた AI プラットフォームと、それらが提供する機能のリストを見ていきます。

グーグル
AI というと、Google が真っ先に思い浮かぶのは当然です。
そして二つ目の名前は?
まあ、少なくとも私には何も思いつきません! 😂 AI に関する会話に関して Google がマインドシェアを独占していますが、それには十分な理由があります。同社は長年にわたり、おそらく数十億ドルをAIの研究と人材に注ぎ込んできた。その野心的な AI プロジェクトのいくつかはよく知られており、その最新の作品を覗いてみると背筋がゾクゾクします。
この深い専門知識により、Google は AI/ML で提供できる最高品質の API をいくつか備えています。主な製品のいくつかを見てみましょう。
テキスト分析 (自然言語処理)
AI における最大の進歩の 1 つは、書き言葉か話し言葉かを問わず、自然言語を理解し、操作することです。 Google の Text Analysis API は非常に強力で、次のような機能を提供します。
- 構文分析 (指定されたテキストを分析し、重要な部分を特定します)
- エンティティ分析 (非構造化ドキュメント内の請求書データの検索など)
- 感情分析(書き言葉や話し言葉から気分や意図などを特定)
- 多言語対応 (多くの言語に対応)
したがって、サポート チャットから顧客の感情を知りたくてウズウズしている場合は、すぐに 試してみてください 。
予測
独自のモデルがあり、新しいデータに対して予測を生成したい場合、Google は専用の予測サービスを提供しています。標準的でないものや実験的なものを目的とする場合には、カスタム コードを追加することも可能です。予測サービスは、次に説明する AI プラットフォームと呼ばれる包括的なサービスの一部です。
AIプラットフォーム
データや AI を扱う人は、プロセスの各ステップがどれほど面倒で時間がかかるかを知っています。こうした問題を解決するために、Google は AI プラットフォーム と呼ばれるエンドツーエンドの包括的なプラットフォームを提供しています。これはデータ サイエンスと ML のためのフルマネージド サービスであり、ML とデータ ラングリングの運用面を可能な限りスムーズにすることを目的としています。
したがって、重要な ML セットアップを行っていて、問題や待ち時間にうんざりしている場合は、Google の AI プラットフォームを検討してみる価値があるかもしれません。
すべての Google AI/ML サービスを説明するには多すぎるため、興味のある方は 公式ドキュメント を参照してください。そこには、もっと深刻で、未踏の、驚くべきことがたくさんあります。

OpenAI
AI 分野に少しでも興味がある人なら、GPT-3 の登場に注目したことでしょう。これは自然言語を扱うための高度な ML モデルであり、終末の日がついに来たのではないかと誰もが 恐れていました (していたのでしょうか?)。 GPT-3 を支えているのは OpenAI です。この組織は、AI 分野での研究とコラボレーションを促進するために設立された組織です。これは今日の世界では珍しいことです。
同社は主に、AI 研究でメディアの注目を集めたとき、創設者の 1 人であるイーロン マスクによって広く知られるようになりました。一例としては、最高レベルでプロの DOTA 2 プレイヤーと対戦し、破壊したゲームプレイ AI がありました。
この記事の執筆時点では、イーロン・マスク氏はもう関与しておらず、OpenAI は設立理念どおり正確には「オープン」ではありません。しかし、それは別の議論であり、それに関する資料はたくさんあります。
私たちにとって、要するに、OpenAI は、特にテキスト処理、ビデオ/ 画像処理 などに関して、AI において非常に画期的な仕事をしているということです。OpenAI はいくつかの AI サービスを API として提供しており、それは簡単に理解できると思います。それぞれの強力な使用例:
- セマンティック検索: 自然言語で提供されるクエリ に基づいて、ドキュメントなどの自由形式のテキスト データを検索できます。したがって、すべてのカスタマー サポート チャットのデジタル化されたライブラリがある場合は、「解決が遅れて顧客が非常に怒っていたチャットのリストを見せて」などと依頼できます。これは正式な例ではありませんが、可能性を明らかにしたかったのです。 😁
- チャットボット: 今日のほとんどのチャットボットは、後悔が詰まった巨大なバスケットにすぎません。ボットの導入を決定した企業は後で後悔し、ボットを作成した開発者は無駄な作成を後悔し、サイトを閲覧した顧客はボットとのやり取りを後悔します。 。 。あなたはその考えを理解しています。対照的に、OpenAI のチャット機能は、特に世間話、予期せぬ会話の展開、間接的な意図などに関してははるかに優れています。もちろん、完璧ではありませんが、チャットボットを不快/愚かなものから、面白い。
- カスタマー サービス: 実行可能なカスタマー サービス エクスペリエンスを作成するには、上記 2 つのサービスを何らかの方法で組み合わせなければならないのではないかと心配している場合、OpenAI はすでにそれを行っています。検索、推奨などの機能を備えた顧客サービス専用のサービスがあります。
- テキスト生成: 先ほど説明した GPT-3 テクノロジーとほぼ同じように、OpenAI は API 経由でテキスト生成機能を提供します。その結果、さまざまなクリエイティブな方法で使用できる、ほとんどすべての内容 (抽象的で奇妙なものでも) についての本物のインテリジェントなテキストが作成されます。
- 理解: このサービスは、指定されたテキストを受け取り、その要約を生成します。はい、それはそのままの言葉で言えます!これにより節約できる時間と、これほど便利な機能の可能性は計り知れません。私の意見では、メール疲れは良い使用例です。AI にメッセージを要約させるだけで、受信トレイを 3 時間ではなく 10 分で空にすることができます。
- その他のツール: OpenAI には、実際の使用時に便利な他のツール/サービスもいくつかあります。たとえば、分析を容易にするために、セマンティック検索結果をスプレッドシートに変換することができます。さらに、テキストをある言語から別の言語に翻訳するサービスもあります (非常に一般的なニーズ)。等々。
OpenAI は 最近 AI の世界で大きな話題を呼びましたが、その API にアクセスするのは簡単ではありません。待機リストに参加するには申請する必要があります。誰が、いつ、どのように承認されるのか、これらも謎のままです。最後に、これらのテクノロジーは非常に強力ですが、完全には成熟していないことを忘れないでください。したがって、サービス全体に「ベータ」というラベルが付けられています。それでも、パイロット プロジェクトに適用して試してみる価値はあると思います。

マイクロソフトアジュール
クラウド製品に関しては、Microsoft は 3 番目に遠く離れた位置にあると言われています (つまり、AWS と Google に次ぐ)。しかし、それはビジネスが困難に陥っているという意味ではありません。同社は独自の特別な戦略 (既存の Windows ビジネスの移行) を持っており、独自の競争を繰り広げています。 Azure という名前はよく知られていますが、そうでないのは、Azure が AI 関連のサービスに関しても強力なサービスを提供しているということです。 Azure Cognitive Services をご紹介します。
Microsoft が AI 分野で nada を行っていると思われる場合は、これをご覧ください。
Azure Cognitive Services は、 インテリジェントで強力なアプリケーションを構築するために必要なほぼすべての機能を備えた本格的な AI 製品です。実際、彼らの API のほとんどには興味深く、より特殊なユースケースがあり、それが彼らに優位性を与えていると私は考えています。以下に、主要な API とその機能の概要を示します。
- 言語: これらの API は、コンピューター サイエンスでいわゆる自然言語処理を中心に構築されています。簡単に言うと、人間の言語(話し言葉か書き言葉か)から意味を抽出し、生成し、操作することです。興味深い機能としては、会話型 QnA メーカー (トレーニング/教育/雇用における可能性を想像してみてください!)、IoT やその他のデバイスへの会話型インテリジェンスの注入、特定のテキストに関するセンチメント分析とその他のメタデータ、翻訳 (執筆時点で 60 以上の言語)、およびもっと。
- 音声: これらの API は、人間の音声を処理する機能をアプリに提供します。主な機能には、音声からテキストへの変換、テキストから音声への変換、音声翻訳、および音声認識が含まれます。
- ビジョン: コンピューター ビジョンは注目のトピックであり、完璧には程遠いものの、ある程度の誤差が許容されるシナリオでは十分な機能を備えています。提供される Vision API には、画像とビデオの分析、オブジェクト認識 (画像とビデオ内の)、顔検出、ビデオ インデクサー (ビデオからメタデータを生成) などの機能が含まれます。
- 意思決定: これは、より適切な意思決定、または ML ベースの意思決定に従うプロセスの改善に役立つ一連の汎用 API です。この領域で提供される機能には、異常検出 (データ サイエンティストにとって非常に便利)、コンテンツ モデレーション、パーソナライゼーション サービス (アプリ ユーザー向けのインテリジェントでパーソナライズされたインタラクションの作成に役立ちます) などが含まれます。
今日の Microsoft は、明確なビジョンを持ち、クラウド、サービス、統合ソリューションに重点を置いており、これまでとは大きく異なります。オンプレミスでもクラウドでも、Windows ベースの運用を実行している場合は、Azure コグニティブ API を製品に統合することがさらに合理的です。

AWS AI サービス
クラウドベースのサービスとインフラストラクチャについて話すとき、アマゾン ウェブ サービス (AWS) について言及しないことはできません。あまり信憑性の高いソースが見つからなかったのでリンクできませんが、どうやらAWSだけでクラウド市場のシェアは約33%あるようです。そして、開発者として、私はこのプラットフォームがあらゆる種類と規模のソフトウェア アーキテクト、CTO、開発者、ビジネス オーナーなどに対して強力な吸引力を持っていることを保証できます。
新しい SaaS 製品の場合、人々は最初から AWS でホストしたいと考えます。スケーリングや安定性に問題がある場合は、AWS に移行したいと考えます。
AWS がクラウド インフラストラクチャとして絶対的に最良の選択肢であるとは言いませんが、AWS のサービス範囲と低価格戦略では他の追随を許しません。重要なのは、(新規または既存の) アプリに AI/ML 機能を組み込むことがリストにある場合、 AWS の AI サービス を利用すれば間違いはないということです。
彼らのエレベーターピッチは次のとおりです。
AWS は、AI/ML に関して、強力で機能が豊富なサービスをいくつか提供しています。それらを簡単に見てみましょう。
- ポリー: テキスト読み上げは、特に企業が人間のような信頼できる声で会話できる真に「生きた」インテリジェントなアプリを作成できるため、最近非常に必要とされている機能です。 Amazon Polly はまさにそれを実現します。出力は夢のようなものではありませんが ( ここ と ここで 公式サンプルを聞いてください)、ほとんどのユースケースでは非常に優れています。
このソリューションを試してみることに興味がありますか?記事を音声に変換する方法を確認してください。
- Transcribe: このサービスは Polly の逆で、音声をテキストに変換します。私はプロジェクトの 1 つで Transcribe を使用してコールセンターの録音を読み取って文字起こしを作成したので、その有効性を個人的に証明できます。出力は非常に正確で (繰り返しになりますが、統計はありませんが、精度は 95% 以上だったと思います)、多少の背景ノイズがあっても、さまざまなアクセントを難なく拾うことができました。さらに、生成されたメタデータの量は驚異的でした。
- Rekognition: Rekognition は、コンピューター ビジョン (画像とビデオ) 用の Amazon のサービスです。顔認識、物体検出、ラベル付けなどの標準的な機能に加えて、コンテンツモデレーション (たとえば、子供が自分のデバイスで見ているものを制御)、有名人認識、機器認識 (作業者の安全と安全のため) などの興味深い機能もあります。コンプライアンス)など。
- 不正検出機能: 不正行為は、企業にとって毎日多大な費用と労力を費やすタールの穴です。このサービスは、新しいアカウントの作成、ゲストのチェックアウト、オンライン支払い、ロイヤルティ プログラムの悪用などに関する不正検出機能を提供することで支援を提供します。このサービスが電子商取引エコシステムにとって非常に役立つことは明らかです。
- Lex: チャットボットが大好きだけど、どこにでもよくある退屈で愚かなチャットボットにうんざりしているなら、Lex が最適です。最新のチャットボットに必要な機能がすべて備わっており、マネージド サービスであるため、サーバーの実行について心配する必要はありません。
- Kendra: Kendra はドキュメント検索サービスですが、検索クエリが人間の言語で行われる点が異なります。このサービスには明らかにいくつかの業界に関する深い「専門知識」が組み込まれているため、データがこれらの業界のいずれかからのものである場合、検索を微調整して精度を高めることができます。
AWS には他にもいくつかのサービスがリストされていますが、すべてをカバーしようとすると紙とインクが足りなくなってしまいます。 😁 それに、AWS について私が知っていることが 1 つあるとすれば、それは ハッブルの法則 に従っており、その結果として宇宙が拡大し続けるということです。あなたがこの記事を読んでいる頃には、AI サービスの数は 2 倍、さらには 10 倍になっているかもしれません。したがって、興味がある場合は、 公式ページ にアクセスして、時間をかけてサービス、機能、コストなどを探索することをお勧めします。
AWS は最高の市場シェアを持っているため、すでに AWS でホストされている可能性があります。それともインフラストラクチャを AWS に移行することを検討していますか?その場合、AWS AI サービスを選択すると、アプリが他の AWS サービス (S3、EC2、SNS など) とシームレスかつ確実に連携できるようになります。インフラストラクチャ間でアプリを分割して保守しなければならなかった人たちと話してみれば、一生納得するでしょう。 😝

パラレルドット
ParallelDots は、これまでのところ、このリストにある企業の人気に遠く及ばないことは明らかです。しかし、それらは珍しい発見であり、もっと注目されるべきだと私は思います。
主に AI 企業である同社は、非常に有用なツールと業界固有のソリューションを作成しています。しかしおそらく最も重要なことは、彼らは量よりも質を信じているようだということです。彼らの製品メニューには (少なくとも現時点では) 項目が 4 つしかありませんが、そのうちの 1 つが一般的で精度が高かったため、私にとって際立ったものでした。私たちが話しているサービスは、 テキスト分析 API です。
上のリンクにアクセスして少し下にスクロールすると、一種のライブ プレイグラウンドが見つかり、ボタンをクリックするだけで任意のテキストを入力し、AI の分析機能を確認できます。
ちなみに、スクリーンショットに表示されているテキストは、彼らが設定したデフォルトです。緑色の「分析」ボタンを押すと、さまざまなカテゴリごとのテキストの分析が下に表示されます (カテゴリはボタンです)。
では、API はどの程度優れているのでしょうか?私は自分自身でいくつかのテストをしてみようと思い、そこにそれほど単純ではないもの、つまり近代文学の古典の 1 つから抜粋した散文を加えました (興味のある方のために、この本は 1957 年に書かれたジャック ケルアックの 『オン・ザ・ロード』 です)。 。まずは本文を読んでみましょう。
私にとって唯一の人は、狂った人々、生きることに狂っている、話すことに狂っている、救われることに狂っている、すべてを同時に望んでいる、あくびをしたり、ありふれたことを言ったりしないが、燃え、燃えている人々です、星々を横切る蜘蛛のように爆発する素晴らしい黄色のローマンキャンドルのように燃えます。
あなたはそれについてどう思いますか?それは何を伝えようとしているのでしょうか?それはどのような気分を反映していると思いますか?これらの質問について、立ち止まって考えてみるのも良いでしょう。
それをテキストボックスに貼り付けて、「分析」をクリックします。何が判明したかは次のとおりです。
全体として、かなり良いです!私が選んだ散文はかなり挑戦的で、明確に何も示していません。しかし、洗練された読者は、際立った不安/怒りの明確な色合いを見つけるでしょう。そしてそれは、API が支配的な感情として示しているものでもあります。ただし、テキストは単なる怒りではなく、それは API の信頼スコア 30.58% に反映されています。 「退屈」と「幸福」に 20% 近くのスコアが割り当てられたことも理にかなっています。なぜなら、支配的なものではないにせよ、これらの感情がテキストに反映されていると私は思うからです。恐怖、悲しみ、興奮。 。 。さて、これらが本文にないなどと言うのは一体誰なのでしょうか?問題は、散文の構成と理解は非常に主観的なものであるため、私の意見に同意できない場合でも、それは問題ありません。 🙂
ただし、個人的には、上記の分析の他の部分を調査したときに、ParallelDots サービスにも同様に感銘を受けました。もちろん、常に的を射ているわけではありませんし、場合によっては奇妙にも感じました。しかし、この記事の前半で書いたように、100% の精度は目標ではありません (おそらく達成不可能です)。目標は、私たちが何十年も夢見ることしかできなかった種類のアプリケーションの構築を支援する強力な AI です。
それで、ParallelDots テキスト分析サービスはあなたに適していますか?
ニーズがテキスト分析に限定されており、非常に高い精度が必要で、ゲームの有名人から選択する際に顧客としての注目が欠けることが気に入らないのであれば、私は「はい」と答えるでしょう。
IBMワトソン
少し前まで、IBM の Watson プロジェクトは、人間に永久に代わる全能の AI でした。それは、 映画の予告編を 作成したり、 Jeopardy で最高のプレイヤーに勝ったりすることでした。終わりは近いです;誰もが心の中で確信していました。 2020 年に早送りすると、ワトソンは世間の記憶のどこにもありません。
しかし、それは、それが後で廃棄された、思いつきのプロジェクトだったという意味ではありません。 AI はその壮大な可能性には及ばなかったものの (あるいは、最初から PR 戦略だったのでしょうか?!)、 ワトソンは IBM の企業向け AI 製品の頭脳として生き続けています。
Watson Solutions の傘下で提供される主なサービスは次のとおりです。
- Watson Assistant: このサービスには、顧客とエージェントの両方のカスタマー サービス エクスペリエンスの向上を目的とした多くのコンポーネントが含まれています。エージェントが情報を迅速に見つけてクエリを解決し、顧客のクエリを理解し、顧客の対応をパーソナライズし、詳細なデータと指標を提供し、そのデータから洞察を抽出できるようにします。Watson Assistant はすべてを実行します。
- RegTech: IBM RegTech は、コンプライアンスを向上させ、リスク管理を組織運営のすべての層に統合することを目的とした強力なサービスです。より詳細なレベルでは、支払い詐欺や金融犯罪などの主要な懸念事項も対象としています。
- Watson Health: Watson Health は、医療業界向けの高度に専門化された AI サービスです。研究、画像診断、コストと品質に関する医療計画の最適化などにおけるデータ関連のニーズへの支援がその機能の一部です。
- AIOps: AI + Ops = AIOps と IBM は述べています。 IT運用の最適化に特化したAIサービスです。 IT ツールチェーンと IT 運用は非常に大規模かつ複雑になる可能性があり、エンタープライズ レベルで実行できるソリューションは存在しないように思えます。これらのシナリオでは、AIOps は問題の早期検出、ソリューションの回復力、意思決定の向上などに役立ちます。
- Watson Media: Watson Media サービスは、大規模なライブ ビデオ ストリーミングに特化しています。 AI 部分により、キャプション生成、ビデオ検索、ビデオ分析などがその場で可能になります。セキュリティカメラのフィードもライブストリーミングの一種であるため、Watson Media は脅威の検出やオブジェクト認識などにも適しています。
IBM には他にもいくつかの AI サービスがあり、それらのすべてについては、 ここで 学ぶことができます。 IBM は AI サービスにとって確実な選択肢ですが、IBM のポジショニングとサービスは大企業から超大規模企業向けに最適化されているため、相互に適合していることを確認してください。
Rev.ai
Rev.ai も、専門知識を開発し、いくつかのことをうまく実行することを信じている AI 企業の 1 つです。ただ 一つ のことだけをうまくやると決めていることを除いて。はい、1つだけです!音声からテキストへの変換。そうです、文字通りそれが彼らが提供するすべてです!他のカテゴリの AI/ML はもちろん、テキスト読み上げさえありません。
読者は Rev で 10% オフになります。
そして、この極度の、狂気に近い執着の結果は?極めて高い精度は、間違いなく世界最高の中でも最高です。そして彼らは この ページで彼らのAIの証拠を提供しています。
ご覧のとおり、彼らのテストでは、Rev.ai が Google の音声認識よりもはるかに正確であることが示されています。このページには同様の比較がたくさんありますが (すべて Google と比較し、Google に勝っていることが示されています)、残念ながらライブ プレイグラウンドはありません (なぜだろうか。大量のコンピューティング パワーを使用するのでしょうか? 何か他の理由があるのでしょうか?)。しかし、だからといってサービスを評価できないわけではありません。無料のアカウントを作成して、必要に応じて API を精査できます。 🙂
Rev.ai は将来さらに多くのサービスを開始する可能性があるため、私はこの記事を「修正」するために急いでいます。しかし、現在はそうではありません。そのため、精度に妥協のない音声テキスト変換サービスが必要な場合は、Rev.ai に注目する価値があります。
ウィットアイ
Wit.ai は、音声処理とテキスト処理の高度な機能を備えた AI プラットフォームです。はい、これは他の NLP サービスやテキスト分析/文字起こしサービスと同じように思えますが、それだけではありません。
- Wit.ai は オープンソース です。したがって、彼らのテクノロジーから学んだり、インフラストラクチャ上でプラットフォームをホストしたりすることを妨げるものは何もありません。
- Wit.ai は、GitHub 上にある単なるコード ダンプではありません。実際に実行中の API サービスでもあり (HTTP API の形式で)、誰でも使用できるようにオープンされています。
- APIサービスは無料です。はい、完全に無料です!実際、非常に無料なので、料金プランは存在しません。 🤣🤣
- Wit.ai は拡張可能であることを目的としています。つまり、その中心的な目的は、多かれ少なかれ、ML モデルの作成、トレーニング、テスト、使用を支援 (後押し?) することです。
上記のリストの最後の点 (拡張性について) については、もう少し詳しく説明する必要があります。Wit.ai は、ユーザーと、コマンドを受け取ってアクションを実行するデバイス の間に 位置することを目的としています。ユーザーは Wit.ai に話しかけたりテキストメッセージを送信したりすると、Wit.ai はメッセージを分析してメタデータを生成できます。ユーザーが何をしたいのか (上のスクリーンショットで「インテント」を探してください)、それをどのようにしたいのか (スクリーンショットのその他の詳細: タスクと日時) を理解すると、関連するコマンドと情報をデバイス。
強調しなければならないのは、既製の Wit.ai にはほとんど機能がありません。全体的なアイデアは、ユーザーに独自の ML モデルの作成を促すことです。このプロセスは一般にイライラするものですが、Wit.ai によって楽しく簡単になります。そしてそこにその強みがあります。無料の API を使用する場合は、レート制限が存在することに留意してください (エンドポイントに応じて、1 分あたりおよそ 100 ~ 250 リクエスト)。
結論
人工知能 (AI)、機械学習 (ML)、ニューラル ネットワーク、データ、モデル、トレーニング、予測。 。 。これらはもはや流行語ではありません。そして、あらゆる画期的なテクノロジーに起こることですが、一旦安定すると、AI はコモディティ化されます。この記事で説明するプラットフォームは、駆け出しのスタートアップであろうと、業界を食い物にする巨大企業であろうと、誰もが同じスーパーパワーを利用できるようにします。
AI を学ぶためにこれらのコースを探索することを忘れないでください。
これはステークホルダーに警告する必要があります。AI/ML (API の有無に関係なく) だけでは、魔法のように成長が促進されるわけではありません (「ソーシャル化」だけでは何も達成できないのと同じです)。 AI はエキサイティングな一方で、平等な競争の場を生み出しました。残りは私たち次第です。 🙂
次に、最新のアプリケーションを構築するための最適な AI フレームワークのいくつかを検討します。