Google フォトを試したことがある人なら誰でも、Google が提供するこの無料の写真保存および管理サービスが賢明であることに同意するでしょう。高度な検索、写真を場所や日付で分類する機能、類似点に基づいてアルバムやビデオを自動的に作成する機能、数年前の同じ日の写真を表示して思い出をたどる機能など、さまざまなスマート機能が詰め込まれています。 Google フォトには、数年前には機械的に不可能だったことがたくさんあります。 Google フォトは、 TensorFlowと呼ばれる機械学習テクノロジーを使用する Google の多くの「スマート」サービスの 1 つです。学習という言葉は、テクノロジーが時間の経過とともに、現在の知識では想像できないほど賢くなることを示しています。しかし、TensorFlow とは何でしょうか?機械はどのように学習できるのでしょうか?それを使って何ができるでしょうか?確認してみましょう。
TensorFlow とは何ですか?
TensorFlow は、Google のオープンソースで強力な人工知能ソフトウェアであり、Google の多くのサービスや取り組みを強化しています。これは、Google Brain チームによって構築された、大規模な機械学習実装用のシステムの第 2 世代です。このアルゴリズムのライブラリは、第 1 世代の DistBelief を継承しています。
このテクノロジーは、計算をステートフルなデータ フロー グラフとして表現します。 TensorFlow のユニークな点は、消費者レベルのモバイル デバイスから世界クラスのマルチ GPU サーバーに至るまで、広範囲のハードウェア上で計算をモデル化できることです。さまざまな GPU や CPU 上で実行でき、大量のコードを変更することなく、さまざまなデバイスやガジェット間での機械学習のスケーラビリティが保証されます。
TensorFlow は、人間の脳が学習と推論においてどのように機能するかを模倣するようにコンピューター システムに指示する Google の必要性から生まれました。ニューラル ネットワークとして知られるこのシステムは、「テンソル」と呼ばれる多次元データ配列上で実行できる必要があります。最終目標は、パターンと相関を検出して解読できるようにニューラル ネットワークをトレーニングすることです。
2015 年 11 月、Google はこのテクノロジーをオープンソース化し、あらゆる種類の製品や研究に採用できるようにしました。研究者、エンジニア、愛好家など、誰でも機械学習の成長を加速し、より短時間でより高いレベルに引き上げることができます。
TensorFlow には独立系開発者からの貢献が非常に多く、Google の貢献をはるかに上回っているため、この動きは正しいことが判明しました。 Wikipedia には、「GitHub には TensorFlow について言及しているリポジトリが 1500あり、そのうち 5 つは Google のものです。」と記載されています。そうは言っても、Quora での議論の 1 つは、リリースされたオープンソース コードは、Google がサービスで使用しているコードから「クリーンアップされた」バージョンではないかと疑っています。
TenserFlow はどのように機能しますか?
シンプルな通常の人間の言語と大幅な単純化を使用すると、TensorFlow の一面を高度な自律フィルタリング テクノロジとして見ることができるかもしれません。このテクノロジーの核心は、機械学習の巨大なソフトウェア ライブラリです。データベースを使用して「意思決定」を支援します。
たとえば、誰かが写真を Google フォトにアップロードしたとします。この技術は、写真のすべての詳細をデータベースと比較し、それが動物の写真なのか人間の写真なのかを判断します。そして、それが人間であれば、性別、年齢、その人が誰であるかまで判断しようとします。写真内の他のオブジェクトに対しても同じプロセスが繰り返されます。
また、写真に写っている人物の身元や写真が撮影された場所などのユーザーのデータを使用してライブラリを強化し、写真をアップロードした個人と全員の両方にとって将来的により良い結果が得られるようにします。それ以外。したがって、「学習」という言葉が生まれます。しかし、それは単に写真からデータを知り、学習することにとどまりません。写真の情報を使ってテクノロジーでできることはたくさんあります。たとえば、同じ人物、同じ場所、同じ日付などの類似した詳細を持つ写真をグループ化できます。顔のパターンを見て、写真に写っている人物がどの家族や友人に属しているかを判断し、その情報を使用して家族旅行のビデオや連続撮影からのアニメーションを作成します。
これは TensorFlow がどのように機能するかについてほんの表面をなぞっただけですが、このテクノロジーの全体像を理解していただければ幸いです。また、1 つの例だけを使用しても、その機能を正しく理解することはできません。
そして、世の中のすべての人工知能愛好家にとって、Google はすでに機械学習に最適化されたコンピューター チップ テクノロジーを開発し、それに TensorFlow を統合していることは言及する価値があります。これはTensor Processing Unit (TPU) ASIC チップと呼ばれます。
TensorFlow についてさらに詳しく知りたい場合は、そのチュートリアル ページにアクセスしてください。
TensorFlow のアプリケーション
私たちは機械学習テクノロジーの初期段階にいますので、それが私たちをどこへ導くかは誰にもわかりません。しかし、将来を垣間見ることができるかもしれない初期のアプリケーションがいくつかあります。 Google が起源であるため、Google が自社のサービスの多くにこのテクノロジーを使用していることは明らかです。
画像解析の詳細
Google フォトの画像分析にこのテクノロジーを使用する例について説明しました。ただし、この画像分析アプリケーションは Google マップのストリートビュー機能でも使用されています。たとえば、TensorFlow は、画像を地図座標と接続し、画像に誤って含まれている車のナンバー プレート番号を自動的にぼかすために使用されます。
音声認識
Google は、音声アシスタントの音声認識ソフトウェアにも TensorFlow を使用しています。ユーザーが音声で指示を出せるテクノロジーは新しいものではありませんが、成長を続ける TensorFlow ライブラリをミックスに組み込むことで、機能が数段レベルアップする可能性があります。現在、音声認識テクノロジーは 80 以上の言語とその言語を認識します。
動的翻訳
機械学習テクノロジーの「学習」部分のもう 1 つの例は、Google の翻訳機能です。 Google では、ユーザーが新しい語彙を追加したり、Google 翻訳の間違いを修正したりできるようにしています。増え続けるデータを使用して、他のユーザーが翻訳したい入力言語を自動的に検出できます。機械が言語検出プロセスで間違いを犯した場合、ユーザーはそれを修正できます。そして、マシンはそれらの間違いから学習して、将来のパフォーマンスを向上させます。そしてそのサイクルは続きます。
TensorFlow の興味深い使用例の 1 つは、Alpha Go です。囲碁をプレイするようにプログラムされたアプリケーションです。囲碁に馴染みのない人のために簡単に説明すると、囲碁は 5,500 年以上前に中国で生まれた 2 人用の抽象的なボード ゲームであり、現在でも継続的にプレイされている最古のボード ゲームです。ルールは単純で、対戦相手よりも多くの領域を囲むという単純なものですが、このゲームは信じられないほど複雑で、ウィキペディアによれば、「目に見える宇宙の原子の総数よりも多くの可能性を秘めている」そうです。
したがって、学習機械テクノロジーが無限の可能性を持って何ができるかは興味深いことです。 18回の囲碁世界チャンピオンであるイ・セドルとの対戦では、Alpha Goは5戦中4勝し、名誉最高の囲碁グランドマスターランクを獲得した。
TensorFlow のもう 1 つの興味深いアプリケーションは、Magenta プロジェクトです。これは、機械生成のアートを作成する野心的なプロジェクトです。実験の初期の具体的な結果の 1 つは、90 秒間のピアノのメロディーです。長期的には、Google は Magenta プロジェクトを通じてより高度な機械生成アートを生成し、そのプロジェクトを中心にアーティストのコミュニティを構築したいと考えています。
2016 年 2 月、Google はサンフランシスコでもアート展示会とオークションを開催し、人間の手を少し借りてコンピューターで生成された 29 点のアート作品を展示しました。最大の作品 6 点は 8,000 ドルもの値で落札されました。コンピュータが本物のアーティストを模倣できるようになるまでには、まだ長い道のりがあるかもしれませんが、人々がアートに支払おうとする金額を見れば、このテクノロジーがどれほど進歩したかがわかります。
iOSのサポート
Android での TensorFlow の機能についてはすでに説明しましたが、その最新バージョンでは、TensorFlow についに iOS デバイスのサポートが追加されました。 iOS 専用に利用できる、または iOS で最初にリリースされた素晴らしいモバイル アプリがたくさんあるため、近い将来、機械学習を採用した優れたモバイル アプリがさらに増えることが期待されることを意味します。 TensorFlow の幅広い採用と応用の可能性についても同じことが言えます。
TensorFlow の将来
学習して独自の決定を下すことができる機械を使って何ができるでしょうか?日常生活の一部として複数の言語を扱う人間として、最初に頭に浮かぶのは言語翻訳です。単語ごとのレベルではなく、文書や本のような長文レベルでの方が多いです。今日の翻訳テクノロジーは語彙に限定されています。中国語で「眠る」を調べることは簡単で、その逆も同様ですが、吉川英治の『武蔵』の 1 章を原文の日本語で放り込んで、その章を英語に翻訳してみてください。私が何を言いたいのか分かるでしょう。
人工知能の未来が音楽で何ができるかを見るのも楽しいです。 Apple の Music Memo アプリはまだ非常に基本的なものですが、すでに録音した歌に自動的にベースとドラムの伴奏を付けることができます。ある SF テレビ番組のエピソードを覚えています。番組の登場人物が、チャートのトップソングをすべて分析し、独自のヒット曲を書くことができるマシンを作成しました。いつかそこに到着するでしょうか?
最後に、 Sunspringについて触れたいと思います。これは、ベンジャミンと名乗る AI 脚本家によって全編が書かれた短編 SF 映画で、ポップソングの音楽の間奏曲も作曲しました。この映画は、ロンドンの 48 時間フィルム チャレンジ オブ SF のために監督オスカー シャープによって制作されました。
今ではターミネーターのことを考えずにはいられません。未来へようこそ。
画像クレジット: Wikipedia 、 TechInsider 、 The Verge 、 Wall Street Journal