Facebookの次の大きなAIプロジェクトは、ユーザーの公開動画でマシンをトレーニングすることです
ビデオを理解できるAIはさまざまな用途に利用できます

人間ができる限り完全に動画で何が起こっているのかを理解するようにAIシステムを教えることは、機械学習の世界で最も難しい課題の1つであり、最大の潜在的なブレークスルーです。本日、Facebookは新しいイニシアチブFacebookユーザーの公開ビデオでAIをトレーニングするという、この重要な作業で優位に立つことを望んでいます。
トレーニングデータへのアクセスはAIの最大の競争上の利点の1つであり、このリソースを数百万のユーザーから収集することで、Facebook、Google、Amazonなどの大手テクノロジー企業はさまざまな分野で前進することができました。 Facebookは、Instagramから収集された数十億の画像でマシンビジョンモデルをすでにトレーニングしていますが、ビデオを理解するための同様の野心のプロジェクトをこれまで発表していません。
人間のように学習する機械の構築に向けた幅広い取り組みの一環
ほぼすべての国と数百の言語にまたがる公開されている動画のグローバルストリームから学習することで、AIシステムは精度を向上させるだけでなく、動きの速い世界に適応し、さまざまな文化や地域のニュアンスや視覚的な手がかりを認識します。ブログで。タイトルのプロジェクトビデオから学ぶは、人間のように学習するマシンを構築するためのFacebookの幅広い取り組みの一環でもあります。
Facebookによると、結果として得られる機械学習モデルは、新しいコンテンツ推奨システムとモデレートツールを作成するために使用されますが、将来的にはさらに多くのことができる可能性があります。動画のコンテンツを理解できるAIは、Facebookにユーザーの生活に関する前例のない洞察を提供し、ユーザーが趣味や興味、ブランドや服の好み、その他の無数の個人情報を分析できるようにします。もちろん、Facebookは現在の広告ターゲティング操作を通じてそのような情報にすでにアクセスできますが、AIを介してビデオを解析できると、ストアに非常に豊富な(そして侵襲的な)データソースが追加されます。
スマウグ
Facebookは、ユーザーの動画でトレーニングされたAIモデルの将来の計画について漠然としています。会社は言ったザ・ヴァージこのようなモデルは、動画のキャプションから高度な検索機能の作成まで、さまざまな用途に使用できますが、広告ターゲティングの情報を収集するために使用されるかどうかについての質問には答えませんでした。同様に、ユーザーが自分の動画をFacebookのAIのトレーニングに使用することに同意する必要があるのか、それともオプトアウトできるのかを尋ねられたとき、同社はデータポリシーユーザーがアップロードしたコンテンツは、製品の研究開発に使用できると述べています。 Facebookはまた、AIシステムをトレーニングするために収集されるビデオの正確な量や、会社の研究者によるこのデータへのアクセスを監視する方法についての質問にも回答しませんでした。
しかし、プロジェクトを発表したブログ投稿では、ソーシャルネットワークは、スマートグラスでキャプチャされたデジタルメモリを取得するためにAIを使用するという1つの将来の投機的な使用法を指摘していました。
Facebookは消費者向けスマートグラスのペアをリリースする予定です今年のいつか。デバイスの詳細はあいまいですが、これらまたは将来のメガネには、着用者の視点をキャプチャするための統合カメラが含まれる可能性があります。 AIシステムをトレーニングして動画のコンテンツを理解できれば、多くの写真アプリで特定の場所、オブジェクト、人物を検索できるのと同じように、ユーザーは過去の録画を検索できるようになります。 (ちなみに、これはユーザーデータでトレーニングされたAIシステムによってインデックス付けされることが多い情報です。)

Facebookによると、スマートグラスを使用してビデオを録画することが一般的になっているため、人々はデジタルメモリの膨大なバンクから特定の瞬間をキャプチャするのと同じくらい簡単に思い出すことができるはずです。これは、関連するクリップが提供される前に、おばあちゃんに誕生日おめでとうを歌うたびに「見せて」というフレーズで検索を行っているユーザーの例を示しています。同社が指摘しているように、このような検索では、AIシステムがデータの種類間の接続を確立し、「お誕生日おめでとう」というフレーズをケーキ、キャンドル、さまざまな誕生日の歌を歌う人々などに一致させるように教える必要があります。人間と同じように、AIはさまざまな種類の感覚入力で構成される豊富な概念を理解する必要があります。
将来を見据えて、スマートグラスと機械学習の組み合わせにより、いわゆるワールドスクレイピングが可能になります。スマートグラスの着用者をロービングCCTVカメラに変えることで、世界に関する詳細なデータを取得できます。実践がで説明されているように昨年からのレポート保護者 :誰かがスーパーマーケットを閲覧するたびに、彼らのスマートグラスはリアルタイムの価格データ、在庫レベル、閲覧習慣を記録していました。彼らが新聞を開くたびに、彼らの眼鏡は彼らが読んだ物語、彼らが見た広告、そして彼らの視線が残っている有名人のビーチの写真を知っていました。
これは極端な結果であり、Facebookが現在調査していると述べている調査の手段ではありません。しかし、それは、高度なAIビデオ分析とスマートグラスを組み合わせることの潜在的な重要性を示しています。これは、ソーシャルネットワークが明らかに望んでいることです。
Facebookは、リールのクリップを推奨するためにAIビデオモデルを展開しました比較すると、Facebookが現在開示している新しいAIビデオ分析ツールの唯一の使用法は比較的平凡です。 Facebookは、本日のLearning from Videosの発表に加えて、TikTokクローンリールでのビデオ作品に基づいた新しいコンテンツ推奨システムを導入したと述べています。 Facebookによると、ポピュラービデオは、同じダンスムーブに設定された同じ音楽で構成されていることがよくありますが、異なる人々によって作成および実行されています。 FacebookのAIは、動画のコンテンツを分析することで、同様のクリップをユーザーに提案できます。
ただし、このようなコンテンツ推奨アルゴリズムには潜在的な問題がないわけではありません。 Aからの最近のレポートMITテクノロジーレビュー ソーシャルネットワークが成長とユーザーエンゲージメントに重点を置いているため、AIチームが、アルゴリズムが誤った情報を広め、政治的二極化を助長する方法に完全に取り組むことができなくなっていることを強調しました。としてテクノロジーレビュー記事によると:エンゲージメントを最大化する[機械学習]モデルは、論争、誤った情報、過激主義にも有利に働きます。これにより、FacebookのAI倫理研究者の義務と、成長を最大化するという同社の信条との間に矛盾が生じます。
gtaのようなゲーム
高度なAIビデオ分析を追求している大手テクノロジー企業はFacebookだけではありません。また、ユーザーのデータを活用して分析を行っているのはFacebookだけではありません。たとえば、Googleは、800万を含む公的にアクセス可能な研究データセットを維持していますキュレーションされ、部分的にラベル付けされたYouTube動画大規模なビデオ理解の研究を加速するのを助けるために。検索大手の広告運用は、最終結果が単にYouTubeでより関連性の高い広告を配信している場合でも、動画のコンテンツを理解するAIから同様に恩恵を受ける可能性があります。
ただし、Facebookは、競合他社に比べて1つの特別な利点があると考えています。十分なトレーニングデータがあるだけでなく、自己教師あり学習と呼ばれるAI手法にますます多くのリソースを投入しています。
自己教師あり学習は、知性の暗黒物質です。通常、AIモデルがデータでトレーニングされる場合、それらの入力は次のようになります。人間によってラベル付け:たとえば、写真内のオブジェクトにタグを付けたり、音声録音を転記したりします。消火栓や横断歩道を特定するCAPTCHAを解決したことがある場合は、AIのトレーニングに役立つデータにラベルを付けている可能性があります。しかし、自己教師あり学習はラベルを廃止し、トレーニングプロセスをスピードアップします。一部の研究者は、AIシステムがドットに参加することを自分自身に教えるため、より深く、より意味のある分析が行われると信じています。 Facebookは、自己教師あり学習について非常に楽観的です。と呼ばれるそれは知性の暗黒物質です。
同社によれば、AIビデオ分析に関する今後の作業は、半教師あり学習法と自己教師あり学習法に焦点が当てられ、そのような技術によってコンピュータービジョンと音声認識システムがすでに改善されているとのことです。 Facebookの28億人のユーザーが利用できるこのような豊富なビデオコンテンツがあるため、AIトレーニングのラベル付け部分をスキップすることは確かに理にかなっています。そして、ソーシャルネットワークが機械学習モデルにビデオをシームレスに理解するように教えることができるとしたら、誰が何を学ぶことができるかを知っていますか?