NVIDIAは、今週、開発者会議「GTC 2022」をオンラインで開催した。 基調講演でCEOのJensen HuangがNVIDIAのAI研究の最新成果を発表した。NVIDIAは科学技術向けメタバースである地球のデジタルツインを生成し、この3Dモデルで気候変動の研究を進めている(下の写真)。 NVIDIAは米国国立研究所と共同で、地球のデジタルツインで台風や集中豪雨の発生を予測するモデルを開発した。 数学モデルではなく、AIで気象の変化を予測することで、処理時間を劇的に短くすることに成功した。 現行の天気予報の仕組み天気予報は、海洋や陸地の状態を数値予報モデル(Numerical Weather Prediction)で表し、これをスパコンでシミュレーションする手法となる。 具体的には、数値予報モデルに、現在の気象データを入力し、将来の値を計算することで状態の変化を予測する。 様々な数値予測モデルが使われているが、ヨーロッパ中期予報センター(ECMWF)が開発した「Integrated Forecast System」がその代表となる。これは「欧州モデル(European Model)」とも呼ばれる。 米国のモデル一方、米国においては、アメリカ国立気象局(National Weather Service)が開発した「Global Forecast System」が使われる。 これは「米国モデル(American Model)」と呼ばれ、米国内の天気予報で使われている。一般に、欧州モデルのほうが高性能で正確な予測ができるとされる。 一方、米国モデルは長期レンジ(最長16日先まで)の予測ができる点に特長がある。両モデルともシステム規模が巨大で、これを実行するには世界でトップクラスのスパコンが必要になる。 AIで天気を予測するこれらに対して、NVIDIAなどが開発した予測モデルはAIを使って気象の状態を予測する。 この予測モデルは「Fourier ForeCasting Neural Network(FourCastNet)」と呼ばれ、短期から中期レンジで、台風(Typhoon)や集中豪雨(Atmospheric River)など、異常気象を予測することができる(下のグラフィックス、中段)。 FourCastNetは、短時間に高精度で天気を予測することができる。欧州モデルに比べ45,000倍高速で予測することができる。 AIで予測する仕組み現行の数値予報モデルは、数学モデルをスパコンで計算し、その解を求める手法であるが、FourCastNetはニューラルネットワークで気象を予測する。 ニューラルネットワークが過去の気象データを学習し、将来のイベントを高精度で予測する。 FourCastNetの教育では、ヨーロッパ中期予報センターの気象データ「ERA5」が使われ、10TBのデータでニューラルネットワークが教育された。 気象予測の事例FourCastNetを使うと台風の発生を正確に予想できる。 実際に、FourCastNetは「Typhoon Mangkhut(平成30年台風第22号)」の発生を正確に予測した(上のグラフィックス)。この台風は、フィリピンや中国、香港などに甚大な被害をもたらした。 FourCastNetが予測する範囲はグローバルで、地球全体をカバーする(中央部)。日本の南の海上でMangkhutが発生した(左側最下段)が、FourCastNetはこれを正確に予測した(左側中段)。 ModulusとOmiverseFourCastNetは地球のデジタルツインに構築され(下の写真)、気象モデルをインタラクティブに操作できる。 デジタルツイン生成では「NVIDIA Omniverse」が使われ、スパコン「Earth-2」で実行された。 また、AIモデルは「NVIDIA Modulus」が使われ、AIで物理問題を解析するためのツールが揃っている。 具体的には、変微分方程式(partial differential equations)を解くためのニューラルネットワークが使われた。 地球温暖化の研究地球のデジタルツインを生成し、FourCastNetというAIモデルで気象予測を実行するのは、日々の天気予報を求めるためではなく、地球温暖化問題を解明する研究の一環となる。
現行モデルで気象予測を実行すると、スパコンを使っても長時間かかる。 これに対し、FourCastNetをEarth-2で実行すると、45,000倍速く予測結果を得ることができる。つまり、数多くのモデルを並列して実行でき(下の写真)、地球温暖化対策の研究を効率的に進めることができる。 ウクライナ(Ukraine)政府はロシアがフェイクビデオを使って情報操作する危険性を表明し、国民に冷静な対応を呼びかけていた。実際に、ゼレンスキー(Zelensky)大統領のフェイクビデオがメディアに掲載された(下の写真)。 偽の大統領は国民に、武器を捨ててロシアに投降するよう呼びかけた。MetaはこのビデオはDeepfakesであると判定し、プラットフォームから削除した。 戦時下においてはAIを使った情報戦が展開されるが、今回はそのプロトタイプが登場し、デジタル兵器の攻防が始まった。 ゼレンスキー大統領の偽ビデオ3月16日、ゼレンスキー大統領がビデオメッセージで、国民に武器を捨ててロシアに投降するよう呼びかけた。 これはウクライナに対する情報戦で、ビデオはアルゴリズムにより生成されたDeepfakesで、本人の演説ではない。Metaはこれをフェイクビデオであると特定し、プラットフォームから記事を削除した(下の写真)。 ロシアがウクライナに侵攻した後、Metaは特別チーム「Special Operations Center」を形成し、24時間体制で情報操作をモニターしており、このフェイクビデオを即座に検知することができた。 ロシアでビデオが拡散このフェイクビデオはMetaのプラットフォームからは削除されたが、他のソーシャルネットワークで拡散している。 メッセージングアプリ「Telegram」にこのフェイクビデオが掲載され、ここには、「ハッカーがウクライナのサイトにこのビデオを掲載した」とのコメントが添えられている (先頭の写真)。また、ロシアのソーシャルネットワーク「VK」にも同じビデオが掲載され、クレムリンを指示するグループで拡散している。 テレビ局のハッキングこれに先立ち、ウクライナのテレビ局「Ukraine 24」がハッキングされ、テレビ画面に偽のテロップが表示された。 フェイク・テロップはニュース画面の下部に表示され、ゼレンスキー大統領からのメッセージと偽り、「戦闘を止め武器を捨てる」よう国民に訴えた(下の写真、最下部)。 また、「大統領は交渉に失敗し、キエフを去った」とも伝えている。 ゼレンスキー大統領の対応フェイクビデオに対し、ゼレンスキー大統領はショートビデオを公開し、偽情報を打ち消した(下の写真、Instagramから配信)。 ショートビデオで、拡散したビデオは偽情報で、つたない手法の攻撃であると非難した。大統領はオフィシャルサイトから、定常的に国民にメッセージをショートビデオで配信しており、今回も、このアカウントから真実の情報を伝えた。 フェイクビデオの完成度実際に、フェイクビデオを見ると、完成度は低く、これは本物ではないと感じる。 頭部が体に比べて大きく、不自然さを感じる。また、喋っている時に、頭部は動くが、体は不動のままで、強い違和感を覚える。 Deepfakesを生成する高度なGANが開発されているが、このビデオは技術的には未熟で、完成の域に達していないことが分かる。このフェイクビデオはプロトタイプと解釈することもでき、これから技術改良が進み、判別が困難になると予想される。 Metaの特別チームロシアはフェイクニュースなどを使って情報戦を展開しており、西側諸国が被害を受けている。
米国においては、2016年の大統領選挙で、ロシアは大規模な情報操作戦を展開し、これがトランプ大統領の当選に繋がったとされる。 Meta(当時はFacebook)は、ネットワークに掲載された偽情報を削除するなどの措置は取らず、米国社会から強い批判を受けた。これを教訓に、2020年の大統領選挙では、特別チームを形成し、偽情報をリアルタイムでモニターし、ロシアのデジタル攻撃を防いだ。ロシアのウクライナ侵攻では、再度、独別チームを形成し、デジタル戦を防衛している。 ロシア軍によるウクライナ(Ukraine)への軍事侵攻が新たな局面を迎えている。ロシア軍は首都キエフ(Kyiv)に迫っているが、ウクライナ軍の反撃が続き、侵攻は足踏み状態になっている。 ウクライナ軍は本土防衛のために、AIなどのハイテクを導入することを明らかにした。 高精度の顔認識システムを導入し、ロシア兵士のIDを特定し、デジタルな防衛網を構築する。(ウクライナ政府は民間施設が攻撃されていることを示し(下の写真)、防衛のための寄付を暗号通貨で募っている。) 顔認識システムウクライナ国防省は顔認識システムの利用を開始したことを明らかにした。これは米国新興企業Clearviewが開発したもので、通信社ロイターが報道した。 Clearviewは世界で最大規模の顔データベースを構築し、その判定精度は業界のトップである。Clearviewはこのシステムを無料でウクライナ軍に提供し、ロシア兵のIDを特定するために使われる。 ロシア兵のIDの特定顔認識システムはロシア兵士の身元を特定するために使われるが、具体的には、攻撃を行ったロシア兵士の氏名などを把握する。 また、死亡したロシア兵士の身元の特定のためにも使われる。戦士のIDを特定するためには指紋が使われるが、顔認識システムだと、その場で顔写真から身元を特定できる。 ロシア軍は工作員を市街地に送り込み、破壊作戦を展開している。このため、チェックポイントなどで顔写真から、ロシア兵士を特定するためにも使われる。 難民の身元の特定顔認識システムは難民の身元を特定するためにも使うことができる。多くの人が戦火を避け、ウクライナを離れ、ポーランドなど近隣諸国に避難している。 難民の多くは家族が離散し、再会が難しくなる。このため、顔認識システムで身元を特定し、家族の再会に役立てる。また、ソーシャルネットワークに掲載されている顔写真を解析することで、情報操作のための偽装工作を見破ることもできる。 ロシア人の顔写真データベースClearviewは世界の人物の顔写真100億枚を収集し、これを顔認識システムのデータベースとして使っている。 被験者の顔写真をこのデータベースで検索し、本人のIDを割り出す。ここには、ロシア人の顔写真20億枚が含まれており、ロシア人のIDを高精度で特定することができる。ロシアの人口は1.4億人で、単純計算で、一人当たり14枚の顔写真が格納されていることになる。 顔写真の収集方法Clearviewはソーシャルネットワークに公開されている顔写真をスクレ―ピングしてデータベースを構築した。 スクレ―ピングとは、顔写真やその属性などを、ウェブサイトからダウンロードする手法を指す。 Clearviewはロシアのソーシャルネットワーク「VK」(下の写真)から顔写真をスクレ―ピングした。VKはロシア・セントペテルスブルグ(Saint Petersburg)に拠点を置く企業で、会員数は5億人を超え、ロシアで一番人気のソーシャルネットワークである。 倫理的な使い方Clearviewのスクレ―ピングの手法は個人のプライバシー侵害にあたるとして問題視されている。 米国では、集団訴訟が起こり、Clearviewの手法が法廷で問われている。イギリス政府は、Clearviewは個人情報保護法に抵触するとして制裁金を科した。 カナダやオーストラリア政府は、Clearviewに対し、個人情報を削除することを求めている。多くの問題を抱えているが、戦時下においては国防に役立つとして、Clearviewの技術に期待が寄せられている。 ハイテクを導入顔認識システムとは別に、ウクライナのデジタル・トランスフォーメーション省は、米国のAI技術を導入することを計画している。既に、欧米企業はウクライナ政府にインターネット通信機器やサイバーセキュリティ・ツールを提供している。 SpaceXは衛星通信システム「Starlink」の受信装置(下の写真右側)を提供している。 ウクライナで地上の通信網が被害を受けているが、衛星通信でインターネットを再構築する。実際に、ウクライナ副首相は、Starlinkの受信装置 (左側)を受領したとツイートし、Elon Muskに謝意を示した。 サンフランシスコでの反戦集会世界各地でウクライナを支援する集会が開催されているが、サンフランシスコでは市庁舎の前で反戦集会が開かれた。
ベイエリアには多くのウクライナ人が暮らしており、数百人が反戦集会に参加し、プーチン大統領にウクライナから撤退するよう呼びかけた。 サンフランシスコ市はウクライナを支援する意思を表明するために、市庁舎を国旗の色にライティングしている(下の写真)。 コロナの感染が下火になり、エンデミックに移行する中、シリコンバレーのIT企業はハイブリッド勤務に移行する。 Googleはリモートワークを終え、4月4日からハイブリッド勤務を始める。社員は週三日、オフィスに出勤する勤務形態となる。Appleも4月11日にオフィスを再開し、5月23日からは、社員は週三日出社のハイブリッド勤務となる。 Google Googleは社員に対し、4月4日までに在宅勤務を終えてオフィスに戻るよう通達を出し、週三日出社のハイブリッド勤務に移行する。今月はトライアル期間で、在宅勤務に慣れたワークスタイルをオフィス勤務に戻すためのプログラムが用意されている。オフィス内では、ワクチン接種を済ませた社員は、マスク着用や定期検査は不要となる。食堂やカフェが再開し、シャトルバスの運行が始まる。Googleはハイブリッド勤務向けに、オフィスレイアウトを大幅に変更している(上の写真、ハイブリッド勤務向け会議室)。来月からハイブリッド勤務が始まるが、その効果を検証しながらワークスタイルを調整するとしている。 Apple Appleも4月11に、リモートワークを終了しハイブリッド勤務に移行する。移行期間中は週1日から2日のオフィス勤務となるが、5月23日からは週3日の出社となる。Appleの場合は出社日が決まっていて、月曜、火曜、木曜がコアの出勤日となる。また、週三日以上勤務することも可能で、社員はライフスタイルに応じて勤務パターンを選択できる。(下の写真、Apple Park) Twitter Twitterは3月15日にオフィスを再開するものの、社員はリモートワークを継続することができる(下の写真、本社ビル)。CEOのParag Agrawalは、社員は最も生産性が上がるワークスタイルを選択すべきと述べている。このために、社員は在宅勤務やオフィス勤務やハイブリッド勤務の中から、自分に最適なスタイルを選択する。同時にAgrawalは、在宅勤務とオフィス勤務が混在することで、仕事の進行が難しくなると予想しており、ハイブリッド勤務を続けながら最適な解を見出すとしている。 Block(旧Square) モバイルペイメント企業Block(旧Square)は、社員が遠隔勤務を続けることを認めている。社員は好みの場所からリモートで勤務することができる。既に、社員は各地に移住しており、会社組織は分散型となっている。管理職は同じ場所の社員だけでなく、遠隔地の社員を管轄することになり、管理職の40%は同じオフィスに部下は誰もいないとしている(下の写真)。管理職はリモートで社員をマネージする技量が必要になる。 Slack Slackはハイブリッド勤務を導入しており、仕事の進行は「非同期型業務(Asynchronous Work)」を推奨している。非同期型業務とは、他の社員とリアルタイムでコラボレーションするのではなく、自分のワークスタイルに合わせて非同期で共同作業を進める方式を指す。社員は仕事に没頭できる時間「コアタイム(Core Time)」を設定し生産性を上げる。コアタイム以外の時間帯に他の社員と共同作業を進める。 SalesforceSlackの親会社であるSalesforceは、オフィス勤務の意義を問い直している(下の写真左側、本社ビル)。ハイブリッド勤務になると、オフィスは他の社員とコラボレーションする場所として利用する。オフィスは個人の仕事場という役割が小さくなる。Salesforceは社員間の交流を重視しており、社外で交流イベントを開催している。Salesforceはサンフランシスコ郊外に山荘「Trailblazer Ranch」を開設し、社員教育や社員の交流の場として使ってる(下の写真右側)。 ポストコロナのワークスタイル シリコンバレーのIT企業はオフィスを再開するが、社員の勤務形態については大きな自由度を持たせている。社員にオフィス勤務を強いると、生産性が上がらないだけでなく、多くの社員が辞めていくという現実がある。一方、完全在宅勤務では社員間のコラボレーションや人間関係の構築が難しい。このため、多くの企業はこれらのバランスを考慮し、ハイブリッド勤務を選択し、ポストコロナのワークスタイルを模索している。
顔認識AIを開発している新興企業Clearviewは、1000億枚の顔写真を収集する計画であることが明らかになった。写真は顔認識AIのデータベースに格納され、被験者を特定するためのインデックスとして使われる。世界の人口は約79億人で、一人につき12枚の写真が収集される勘定になる。このAIを使うと、世界の全ての人物の身元を特定することができる。 顔認識AIの開発 このAIを開発しているのはClearviewという新興企業で、世界最大規模の顔データベースの構築を計画している。投資家向けの資料がネットに流出したことで明らかになった。この資料によると、Clearviewは、現在、100億枚の顔写真を格納したデータベースを運営している。これを、1000億枚に拡充するために、資金の調達を進めている。 データベースの規模と判定精度 この規模のデータベースを使うと、AIは顔写真から、世界の殆どの人物の身元を正確に特定できる。具体的には、世界の人口の98%を、99.5%の精度で判定することができる。現在、Clearviewは100億枚の顔写真を格納したデータベースを運用しており、カバー範囲は75%となる。1000億枚の顔写真を使うと、世界の殆どの人を特定できる顔認識AIが生まれる。 利用目的 Clearviewは高精度な顔認識AIを開発し、米国政府を中心に、治安維持を目的に使われている。Clearviewの顔認識精度は、他の製品に比べひときわ高く、犯罪捜査で顔写真から容疑者の身元を特定するために使われる。昨年の米国連邦議会襲撃事件では、900超の顔写真をClearviewで解析し、350人の身元を特定することができた。このシステムは、FBI(連邦捜査局)や国土安全保障省などで使われている。 ベンチマーク結果 Clearviewは世界でトップレベルの性能を持っている。米国では、NIST(国立標準技術研究所)が顔認識AIのベンチマーク結果を公開しており、世界のベンダーの判定精度を知ることができる。これによると、中国Sensetimeがトップで、Clearviewは二位の判定精度となる。しかし、Clearviewは、Sensetimeより大きなデータベースを持ち、実効性能で上回るとしている。因みに、第三位はロシアVisionLabsで四位もロシアNTechLabとなる。 データベースの規模 世界でトップレベルの判定精度を持つClearviewであるが、その開発手法が社会問題となっている。AIが被疑者の写真から本人の身元を特定するためには、解析した写真と同一の人物を、データベースから見つけ出す。このため、データベースの規模が大きいほど、マッチングの確度が上がる。 データ収集の手法 Clearviewは世界のウェブから顔写真を収集する手法でデータベースを開発してきた。Facebookなどソーシャルネットワークに掲載されている顔写真を、本人の許可なくダウンロードし、これをデータベースに格納する。これは、スクレ―ピングという手法で、個人のプライバシーを侵害するとして、米国社会で問題視されている。実際に、全米各地で集団訴訟が起こり、Clearviewの手法は法廷で問われることになる。 ビジネスモデル Clearviewの顔認識AIは、治安当局による犯罪捜査で使われている。Clearviewは、データベースの規模を10倍に拡大するとともに、顔認識AIの新しいビジネスモデルを計画している。対象を政府官庁から企業に拡大し、顔認識AIで、セキュリティや顧客サービスなどのソリューションを開発する。特に、金融機関やギグ・エコノミー(Gig Economy)向けを重点分野とし、事業開発を進める。 金融機関向けソリューション Clearviewは顔認識AIを金融機関向けに提供することを計画している。これは、マネーロンダリングを検知するためのソリューションで、顔認識AIで利用者が犯罪者リストに登録されているかどうかを検知する。これは「One-to-Many Analysis」と呼ばれる手法で、利用者の顔写真でデータベースを検索し、身元を特定する。偽名を使った犯罪行為を検知できる。 ギグ・エコノミー向けソリューション Clearviewはギグ・エコノミー向け顔認識AIに対する需要が大きくなると予想している。ギグ・エコノミーとは、ネットを通じた雇用制度で、契約社員として単発で働く方式を指す。Uberなどのライドシェアがギグ・エコノミーの代表となる。企業側はギグ・ワーカーを採用する際に、顔写真を顔認識AIで解析し、過去の履歴を確認する。この他に、Walmartなど小売店舗は、万引き防止のために、顔認識AIで容疑者の身元を特定するなどの活用法が検討されている。 治安維持かプライバシー保護か 米国ではサンフランシスコなど主要都市が顔認識技術の使用を禁止したが、連邦政府レベルではこれを規制する法令は無い。顔認識技術の利用について、統一したガイドラインは無く、運用の可否は各政府機関に任されている。顔認識技術を提供するAmazon、IBM、Microsoft、Googleは、無用の混乱に巻き込まれるのを恐れ、自主的にビジネスを停止している。Clearviewは、独自の解釈で、顔認識AIを提供する方針を貫いている。高精度な顔認識AIが犯罪捜査に寄与し、社会の治安が保たれていることは事実である。一方、Clearviewは、個人の顔写真を無断で使っており、これがプライバシー侵害に該当するのか、法廷で審理が進んでいる。
Apple Siriが急に色あせてきた。AIにより生成されるボイスの品質が進化し、今では人間の表現力を上回る。 AIで生成される音声は「Synthetic Voice」と呼ばれ、人間のように流暢な喋りができるだけでなく、多彩な感情を表現できる。アニメやゲームの中でアバターが喋る言葉はAIで合成され、人間のように感情がこもった会話が交わされる。 感情豊かなAIボイス 多くの企業がAIボイスを開発しているが、英国に拠点を置く新興企業Sonanticは、感情豊かな合成音声を開発している。生成された音声は人間のものと区別がつかないだけでなく、声優のように、感情に富んだ会話ができる。AIボイスと言えば、Apple SiriやAmazon Alexaが普及しているが、声はモノトーンで機械的な会話となる。新興企業から新世代のAIボイスが登場し、Google Assistantなどの魅力が色あせてきた。 デモビデオ Sonanticが開発するAIボイスは聞き手を会話に引き込む魅力を持っている。Sonanticはデモビデオを公開しAIボイスの進化をアピールしている(https://www.youtube.com/watch?v=gS1m_TIxEW0)。ビデオで、女性が視聴者に語り掛けるが、これらはAIにより生成されたもので、言葉の端々に微妙な感情表現が窺える。また、言葉ではない、笑いや息遣いが混じり、人間らしさがひときわ際立つ。 微妙な感情表現 微妙な感情表現は「Subtle Emotions」と呼ばれ、人間らしさを演出する技術となる。その一つが、男女関係における駆け引きで、相手の気を引こうとして媚びた感情を表現する。現実社会の会話でも、これは高度なテクニックになるが、AIボイスはこれをマスターし、なまめかしく魅力的な声で男性を誘惑する。また、目立たないようにする控えめな表現や、相手の好奇心をくすぐる表現もできるようになった。 言葉にならない表現 AIボイスを人間らしいと感じるのは、言葉以外の発声が混じるためである。これらは、「Non-Speech Sounds」といわれ、息遣いや、咳払いや、笑いなどを指す。また、「あー」とか「えー」など、無駄な発声もこの区分となる。人間は、スピーチするときには、これらの口癖を矯正するように教えられるが、AIボイスはあえてこれらを取り込み、人間臭さを演出する。(下の写真、発声の最後に咳ばらいを挿入する操作。) AIボイスの生成方法 AIボイスはダッシュボードでインタラクティブに生成する(下の写真)。アバターが発声するテキストを入力し、それに感情を付加するプロセスとなる。例えば、「The enemy fleet is attacking」というテキストを入力すると、音声が合成される。その際に、シーンに応じて、言葉に感情を与える。ここでは、「怒り」、「恐怖」、「幸せ」、「悲しみ」、「絶叫」などの要素を注入できる。また、声のピッチやタイミングなどを設定できる。 ゲームで使われている ゲーム開発会社Obsidianはアバターが喋る言葉をSonanticで合成している(下の写真)。今までは、声優がシーンに合わせて音声を吹き込んでいたが、今では、Sonanticの技術を使っている。AIボイスは声優のレベルに達し、人間がマニュアルで声を吹き込む必要がなくなった。また、AIボイスはゲーム開発の進行に応じて、シーンの変更があれば、何度も作り直すことができ、コンテンツ開発が効率化された。 ニューラルネットワーク Sonanticはニューラルネットワークを人間の声で教育し、AIボイスを生成する手法を取る。人間らしいAIボイスを生成するためには、教育データの品質がカギとなる。このため、声優に様々な感情を含む声を録音してもらい(下の写真)、それを教育データとして使った。しかし、「Non-Speech Sounds」については、この方法では高品質なAIボイスを生成できなかった。このため、SonanticはNon-Speech Sounds向けに独自のニューラルネットワーク開発し、AIボイスが息遣いをマスターした。 声優の役割 声優はゲームやアニメや映画で欠かせない存在であるが、いまその役割がAIボイスで置き換えられている。声優は、声の吹込みから、AI開発のための教育データの生成に、その役割が変わってきた。長年、エンタメ業界を支えてきた声優の職をどう守るかが問われている。 会話の表現方法 会話はその内容より話し方など表現方法が意思伝達で重要な役割を担う。会話の中で伝達された情報より、それがどのような形で伝わったかが、発言者の意図を把握する手段となる。このため、高度なコミュニケーションを構築するには、AIボイスが感情を表現できることが必須の技術となる。 倫理的な使い方 AIボイスは聞き手の感情を操作する能力を持ち、その使い方には注意を要す。メタバースでは、自身のデジタルツインを介してコミュニケーションするが、会話の相手は人間だけでなく、AIとの対話が始まる。AIが多彩な表現力を駆使して、消費者に高額な商品を販売し、危険な契約を結ばせる。AIボイスを使ったヘイトスピーチや虐めが始まると、今以上にダメージが深くなる。高度なAIボイスが悪用されると、その被害は甚大で、倫理的な使い方のガイドラインの制定が必須となる。
米国でNFT取引がブームを通り越しバブルとなっている。NFTとは、デジタルアセットの所有権を示す証文で、これによりデジタルアートやアバターなどを売買するビジネスが生まれた。しかし今では、価値があるとは思えないデジタルアートをセレブがこぞって購入し、これにより価格が高騰し、市場が危険な水域に入った。 退屈したサルサルをモチーフにした「Bored Ape Yacht Club」(上の写真)が破格の値段で取引されている。これはデジタルアートのコレクションで、「ヨットクラブの退屈したサル」というテーマとなっている。1万種類のサルが生成され、それらがNFTとして売買されている。これらの作品は1点が140 ETH (約5200万円)で、常識外の値動きとなっている。 セレブがNFTを購入 何の変哲もないデジタルアートになぜ破格の値段が付くのか議論を呼んでいる。理由の一つが、著名人の影響で、セレブが競ってNFTを購入しているという事情がある(下の写真)。有名モデルParis Hilton(左側の人物)と、トーク番組司会者Jimmy Fallon(右側の人物)は、相次いでBored Ape Yacht Clubを購買した。両者はトークショーで、NFTをプリントアウトしたものを示し、一躍、Bored Ape Yacht Clubの名前が全米に広がった。このようなセレブの“PR活動が”NFT人気を押し上げている。 何のために購入するか Jimmy Fallonは購入したデジタルアートをTwitterのプロフィール写真として使っている(上の写真、左上のアバター)。NFTを本人を表すアバターとして使っている。高額なNFTをアバターとして使うのは、レアな作品を所有していることを誇示する目的がある。しかし、最終目的は投資のリターンで、NFTを転売して利益を得ることにあるといわれている。このた、プロフィールを“広告塔”として利用し、価格を吊り上げているとの解釈もある。 トランザクションの内容が分かる Jimmy Fallonが購入したアートは作品番号「#599」(下の写真)で、2021年11月7日に46.6 ETH (当日のレートで約$216,000=約2500万円)で落札している。NFT収集家「collector936」から購入している。このNFTはブロックチェーン「Ethereum」で生成されており、過去のトランザクションすべてが「Block」と呼ばれるデータベースに記録されている。このBlockは公開情報で、誰でもこれを見ることができ、購買に関する全ての情報が分かる。これがブロックチェーンの特徴で、Jimmy Fallonが落札した価格や購入先などを知ることができる。 NFT価格の推移 セレブが競ってNFTを購入している。Jimmy Fallonの他に、ラップ歌手Eminemやバスケットボール選手Steph CurryがBored Ape Yacht Clubを購入した。これらがニュースで報道され、NFTの人気が高まり、価格が上昇している。Bored Ape Yacht Clubの取引価格の推移を見ると(下の写真、折れ線グラフ)、2021年11月ころから価格が上昇に転じていることが分かる。 Bored Ape Yacht Clubとは Bored Ape Yacht ClubはYuga Labsという団体により開発されたNFTであり、ヨットクラブに属する退屈したサルというストーリーになっている(下の写真)。デジタルアートはプログラムで生成されたもので、170の特徴量を変化させ、1万種類のサルのイメージを生み出した。NFTはEthereumで生成されるトークンで、「ERC-721」という規格に準拠し、データは分散ファイルシステムに格納される。 NFTの危険性と将来性 デジタルアートの価値の評価は難しいが、特定のNFT価格が常識外の値動きを示している。また、デジタルアートを盗み、それをNFTに変換した模造品の販売が広がり、深刻な問題となっている。また、メタバースで、土地というデジタルアセットの購入が進み、不動産ブームが起こっている。米国において、メタバースで危険な投資が広がり、NFTという新しいビジネスモデルが試されている。
米国でNFT取引がブームになっている。簡単にNFTを生成でき、これを高値で販売して、短時間でリッチになれる。 NFTとは、ブロックチェーンで稼働するトークンで、デジタルアセットの所有権を示す。 NFTは新しいコンセプトで、その仕組みは正しく理解されていない。このため、NFT売買で不正行為が始まり、消費者やクリエーターが被害にあっている。 メタバースでデジタルアセットの販売が始まるが、その知的財産権の管理が大きな課題となる。 NTFでリッチになれるNFTで短時間に利益を得る行為は「Get-Rich-Quick」と呼ばれ、米国社会で話題になっている。 多くの実例が報道され、これがNFTブームを押し上げている。先月、ジョージア州アトランタ郊外に住む二人の女性は、アヒルをテーマとするデジタルアートを創作し、それをNFTとして販売したところ(上の写真)、6時間で12万ドル(約1400万円)の収入を得た。 二人は生活費に困る生活をしていたが、収入を土地のローン支払いに充て、差し押さえを回避したと報道された。 NFTが高値で売れる仕組み このNFTは1万点から成るアヒルのデジタルアートで、「Dastardly Ducks」と命名され販売された。 デジタルアートはプログラムで生成され、同じテーマを保ちながら、パターンを変化させることで、1万種類のデジタルアートを生成した。 これらがNFT収集家により購入され、短時間で高収入を得た。今では、これらのデジタルアートが、NFT収集家により転売されている。 1点の値段は0.0036 ETH (Ethereum) で、今日の相場では 10.60ドルとなる。 アヒルのデジタルアートに10ドルの価値があるのか判断が分かれるが、値上がりが期待できるとして、NFTの売買が進んでいる。 NFTとは NFTとはブロックチェインで構成されるトークンで、デジタルアセットなどの所有権を示す証文となる。 NFTのデータは、ブロックチェインの分散データベースで安全に管理される。上記のケースでは、NFTはブロックチェイン「Ethereum」で運用されている。 更に、NFTの売買に関する規定は、スマート契約機能「Smart Contracts」でプログラミングされる(下の写真)。 アヒルのアートはこの契約に基づき、マーケットプレイス「OpenSea」で売買された。 模造品の販売 NFTという新しい事業モデルで市場が急拡大しているが、同時に、様々な違法行為が発生している。 デジタルアートは簡単に複製できることから、その模造品が生成され、マーケットプレイスで販売されている。 Eコマースサイトで、ブランド品の模造品が販売されるように、盗用したデジタルアートのNFTが販売されている。 しかし、デジタルアートは複製したものと見分けはつかず、犯罪行為を防ぐのは容易ではない。 被害が広がっている テキサス州サンアントニオに住むアーティストAja Trierは、犬をモチーフにしたデジタルアート「Starry Night Dogs」を制作している。 犬の背景が、ゴッホの星月夜「The Starry Night」のデザインで、独特の筆遣いがデジタルアートに取り込まれている。 TrierはこのデジタルアートをNFTに変換し、マーケットプレイスで販売している(下の写真)。 このデジタルアートが盗まれ、犯罪者はこれをNFTに変換し、マーケットプレイスで販売していることが判明した。 簡単に複製でき被害が広がる 犯罪者は、デジタルアートのファイルをダウンロードし、それをNFTに変換して販売する。 デジタルファイルをNFTに変換するプロセスは「Mint」と呼ばれ、ブロックチェインでトークンを生成する作業となる。 このプロセスはシンプルで、技術の知識は必要なく、誰でも容易に実行できる。 今では、この盗用作業がソフトウェア・エージェント(Bot)で実行され、被害が広がる要因となっている。 模造品への対応 クリエーターは、自分の作品がコピーされ、NFTとして販売されていれば、そのサイトの管理者に連絡し、それを取り下げてもらう措置を取る。 また、NFTが取引されるマーケットプレイスは数多くあり、これらのサイトで模造品の販売をチェックする必要がある。消費者は、NFTを購入する前に、デジタルアートの持ち主を確認し、被害を防ぐことが求められる。 NFT市場が拡大するが、消費者を保護する仕組みは無く、詐欺にあわないためには、自分で防衛するしか手は無い。 メタバースが抱える最大の課題 メタバースではデジタルアセットの売買が主要な収入源となると期待されている。 デジタルアセットは、デジタルアートの他に、写真(下の写真)やコレクタブルなどが対象となる。 これらがNFTとして売買されるが、模造品による犯罪行為が懸念されている。 簡単に複製できるデジタルアセットを如何に安全に取引できるかが課題となる。 【NFTの法的解釈】デジタルアートとNFTの関係 NFTは新しいコンセプトで、これに関連する知的財産権(著作権や商標権など)の理解が進んでいないことが、被害を拡大する要因となっている。 NFTの売買条件は「Smart Contract」で規定されるが、多くのケースで、NFTだけを購入する条件となっている。 具体的には、購入者は、NFTとデジタルファイルを得るが、デジタルアートの知的財産権は含まれていない。 つまり、NFTを購入しても、デジタルアートの知的財産権を得ることはできない。 現実社会でのアート取引とは異なり、購入者はNFTを得るが、デジタルアートの所有権を得るわけではない。 NFTを購入する際は、NFTを高値で購入してもアートの所有者にはなれないということを理解しておく必要がある。 模造品の販売は違法ではない? NFTに関する法整備が進んでいない現在では、NFTの模造品を販売することの法的解釈が議論となっている。
犯罪者は、デジタルアートを盗んで、それを販売しているのではなく、そのNFTを販売している。 NFTには知的財産権は含まれておらず、犯罪者は制作者の知的財産権は侵害していないという議論がある。 知的財産権は製作者が所有し、犯罪者はその証文であるNFTというトークンだけを販売している。 ブロックチェインが内包する問題の一つで、これから議論を進め、関連法令の整備が必要となる。 Meta(Facebook)は、今週、スパコンを開発していることを明らかにした。 最大性能は5 Exaflopsで世界最速のマシンとなる。 Metaが独自でスパコンを開発するのは、AIとメタバースの開発で、大量の演算処理が必要になるため。 AI開発ではアルゴリズムの規模が巨大化し、その教育には高速プロセッサが必須となる。 メタバースはAIと密接に関連し、3D仮想社会を生成するには、高精度なコンピュータビジョンが求められる。 スパコンの概要Metaは、スパコンを「AI Research SuperCluster(RSC)」(上の写真)と呼び、AI研究のための高速計算機と位置付ける。 今年中旬の完成を予定しており、演算性能はExaflopsを超える。(Exaflopsとは1秒間に10の18乗(10^18)の演算を実行する性能。) 現在、最速のマシンは442 Petaflops (0.442 Exaflops)で、ついにスパコンがExaの領域に入ることになる。 研究テーマ スパコンは、名前が示しているように、AI研究で使われる。 Metaは、自然言語解析(Natural Language Processing)やコンピュータビジョン(Computer Vision)の開発をスパコンで実行する。 これらAIモデルはアルゴリズムが巨大化し、その教育で大規模な演算が発生する。パラメータの数が1兆個を超え、もはや、スパコン無しにはAIを開発することができない。 自然言語解析:有害コンテンツを検知 自然言語解析はソーシャルネットワークの有害情報(Harmful Contents)を検知するために使われる。 FacebookやInstagramで、フェイクニュースやヘイトスピーチが拡散し、社会問題となっている。 今では、ワクチンに関する偽情報が拡散し(下の写真)、ワクチン忌避者が増えている要因とされる。 これら有害情報をAIで正確に検知する技術は確立されておらず、ソーシャルネットワークの責任が厳しく問われている。 Few-Shot Learning AIが有害情報を正確に検知できない理由は、教育データが不足しているため。アルゴリズムを教育するには、大量のデータを必要とするが、有害情報に関するデータは少ない。 例えば、ワクチンに関する偽情報は、少ないだけでなく、その内容は短期間で移り変わる。 このため、Metaは少ない事例でAIを教育する「Few-Shot Learning」という技法を開発している。 このモデルで判定精度を上げるためには、アルゴリズムのサイズを大きくする必要があり、AIが巨大になる。 大規模なモデルを教育するためにスパコンが必須のインフラとなる。 コンピュータビジョン:メタバースの開発 次世代プラットフォームであるメタバースを開発するために、スパコンが必要となる。 メタバースは3D仮想社会で、利用者はアバターを介し、オブジェクトとインタラクションする(下の写真)。 メタバースにアクセスするためにAR・VR・MRグラスが使われ、デバイスに仮想社会が生成される。 高品質な仮想社会を生成するためにコンピュータビジョンが重要な役割を果たし、この開発でスパコンが必須となる。 システム構成 スパコンのプロセッサにはNVIDIAのAIシステム「NVIDIA DGX A100」(下の写真)が使われる。 このシステムはNVIDIAの最新プロセッサ「A100」を8台搭載した構成で(①の部分)、高速ネットワーク「InfiniBand」で通信する。 スパコンは16,000台のA100を搭載し、最大性能は5 exaflopsとなる。 スパコンはDGXを連結したクラスタ構成で、AI Research SuperClusterと呼ばれる。 巨大テックがAIスパコンを開発 アルゴリズムが巨大化の道をたどり、AI開発ではスパコンが必須の計算環境となる。
Googleは大規模アルゴリズムの開発でAIクラスター「Cloud TPU」を使っている。 Microsoftは独自でAIスパコンを開発し、大規模言語モデルを開発している。 これからは、メタバースの開発で高速プロセッサが必須となり、スパコンの用途が拡大することになる。 Meta(Facebook)は、NFT市場に参入し、メタバースでデジタルアセットを販売することを計画している。 NFTとはNon-Fungible Tokenの略で、デジタルアセットなどモノの所有権を示す証文(Token)となる。簡単に複製できるデジタルアセットにNFTを付加し、ブロックチェインで商取引を実行する。 デジタルアートが破格の価格で取引され、NFT市場がにわかに注目を集めている。 MetaのNFT計画これは Financial Times が報道したもので、MetaはNTF市場に参入し、ここでコレクタブルを販売することを計画している。具体的には、Meta配下のFacebookとInstagramは、利用者のプロフィールにNFTを掲載する機能を搭載する。また、利用者が、これらソーシャルメディアで、NFTを生成することもできる。 更に、MetaはNFTのマーケットプレイスをオープンし、ここでNFTの売買を行う。実際に、Metaが発表したメタバースには、NFTを購買するシーンがあり(上の写真)、最終的には仮想社会でデジタルアセットの販売で使われる。 NFTとはそもそもNFTとは、ブロックチェインで構成されるトークンで、デジタルアセットなどの所有権を示す証文となる。NFTのデータは、ブロックチェインの分散データベースで安全に管理される。 現在、NFTで使われるブロックチェインは「Ethereum」が殆どで、事実上の業界標準となっている。NFTは、Ethereumのスマート契約機能「Smart Contracts」を使い、インテリジェントに処理を実行する。事前に設定されたルール(契約)に基づき、人間の介在無しに、ソフトウェアが売買のトランザクションを実行する。 NFTにより、デジタルアセットの所有権が証明され、デジタルアセットの売買をクラウド上で実行できる。(厳密には、NFTはトークンであるが、今では、NFTが付与されたデジタルアセットもNFTと呼んでいる。) NFTマーケットプレイスNFTの市場規模は400億ドルといわれ、その規模が急拡大している。 NFTはマーケットプレイスというわれるサイトで売買される。この市場のリーダーは、ニューヨークに拠点を置く新興企業OpenSeaで、NFTブームで急成長している。 OpenSeaは、オンラインサイトでNFTを生成する機能を提供しており、クリエータはここでデジタルファイルをNTFに変換する。 生成したデジタルアセットをマーケットプレイスに掲載して販売する。このサイトには、デジタルアートやコレクタブルなど、幅広いNFTが掲載されている。 OpenSeaはEthereumで構成されたシステムで、売買は暗号通貨「ETH(Ethereum)」などで実行される。(下の写真、OpenSeaに掲載されているデジタルアート、希望価格は2 ETH (5,456.42ドル)で、オークション方式で販売されている。) NFTの生成方法NFTは誰でも簡単に制作することができる。 OpenSeaのケースでは、作成画面の指示に沿ってデータを入力していくと、NFTを生成できる。イメージやビデオやオーディオなどをNFTに変換することができる。これらデジタルファイルをアップロードして、NFTに変換するプロセスとなる。 この処理は「Mint」といわれ、デジタルファイルに所有者を証明するトークンを生成する作業となる。生成されたトークンはブロックチェインに安全に保管される。 Mintのプロセスは有料で、利用者は処理費用「Gas Fee」を支払う。生成したNFTをマーケットプレイスで販売するが、作品が売れると手数料を支払う構造となる。 デジタルアートが高値で売れる デジタルアートが高値で売れ、NFTブームが続いている。 先月、NFTマーケットプレイスNifty Gatewayで、デジタルアートが91,806,519ドル(約104億円)で販売された。 これはPakが制作した「Merge」という作品で(下の写真)、コンピュータで制作され、デジタルファイルとして売られた。 ファイルには証明書NFTが添付され、これがアートの所有権を示す。(「Merge」は312,686のユニットから構成され、28,983人が購入した。一つのデジタルアートが312,686のNFTで構成されるという特異な構成。 作品が転売されるごとにトークンがマージ(Merge)し、その数が減り、作品の価値が上がると説明している。) NFT市場の危険性今では、アートやコレクタブルや写真などがNFTで販売され、デジタルアセットが投資の対象となっている。
株式取引とは異なり、NFTへの法規制は無く、トランザクションで詐欺や不正行為が発生しているのも事実である。 生まれたての技術で、新しいビジネスモデルが市場で試されている段階で、NFT購入には高度な判断が求められる。 |