人工知能(AI)の発展により、さまざまな産業でその技術が導入されるようになりました。ワーナー ブラザーズがこの技術をどのように実装したかを見てきました。今回、音楽ストリーミング サービスの Deezer は、曲の中から露骨な歌詞を見つけて必要な単語を削除し、あらゆる年齢層が聴けるようにする AI モデルを構築しました。
明示的な歌詞を見つけて曲から分離する作業は、人間のオペレーターが行うことができます。ただし、それは面倒なプロセスになる可能性があります。そこで、より簡単にするために、 同社は曲の個々のトラックを分離して歌詞の部分を分析するツール Spleeter を構築しました 。
Spleeter は、音楽情報検索 (MIR) に取り組む研究者を支援するために構築されたツールです。 基本的には、「最先端の」ソース分離アルゴリズムを使用して、MIR 研究者が「ミックス トラック」から個別のトラックを取得できるようにします 。
曲が「露骨な」曲としてタグ付けされている場合 (通常は「保護者向け勧告」ラベルが付いています)、それは子供にはふさわしくないことを意味します。現在、Deezer などのストリーミング サービスに「明示的な」タグなしで曲が送信されると、その曲がすべての年齢層に適していることを意味する可能性があります。ただし、場合によって は、音楽レーベルが曲の露骨な内容を分析せず、そのままリリースしたことを意味する場合もあります 。
現在、既存の機械学習モデルを使用するには、テキストベースのトランスクリプトを使用する必要がありますが、それを見つけるのが難しい場合があります。ただし、ディープ ニューラル ネットワークを使用する代替アプローチもありますが、結果を得るためにシステムが使用する複雑な処理関数について研究者が常に知っているとは限らないため、信頼性が低い場合もあります。
そのため、Spleeter を使用することで、研究者はリアルタイムよりも 100 倍速いため、音声トラックを実際の曲から非常に迅速に分離できます。したがって、
巨大なデータセットを処理する場合には、これが良い選択肢であることが証明されるはずです
。また、このシステムは「キーワード スポッティング システム」と呼ばれる技術を使用して、音声トラック内の「明示的な」単語を検出します。
研究者らは、「ブラックボックス」モデルと、曲の歌詞を取得してテキストから直接キーワードを検出する「オラクル」システムを使ってモデルをテストした。 Spleeter はブラックボックス モデルを打ち破ることはできましたが、「Oracle」システムには及ばなかったのです。それにもかかわらず、ブラックボックス モデルを打ち破ることは、このツールにとっても非常に大きな意味を持ちます。
そのため、MIR 研究者は、Spleeter を利用して音声トラックを分離し、重要な「明示的な」単語を分析することで、子供向けの露骨な曲を簡単に作成できます。






![2021 年に Raspberry Pi Web サーバーをセットアップする方法 [ガイド]](https://i0.wp.com/pcmanabu.com/wp-content/uploads/2019/10/web-server-02-309x198.png?w=1200&resize=1200,0&ssl=1)


