今日から繋げる古代風景

日々の出来事を無理やり歴史に紐付ける人

2023年の音声合成周りの記録

AIが発達してきて、ここ数年で情勢変わりそうなので、

現状をなるべく色んなサイトURLと共に記録しておく。

 

音声AIの変化(キャラクター性の不要)

最近、

ネットのサブカルに興味ない人たちのスマホから、ずんだもんを始めとする合成音声による解説が流れてくるようになった。

視聴者は、ずんだもんがどういったキャラ設定なのかを知らない。

声オタ以外が声優を意識せずナレーションを聞くように、動画の一要素として音声合成を聴いているし、利用されている。

 

これは、初音ミクを始めとする、日本の合成音声の文化から見ると驚くことだ。

オタクのネット文化で育った、初音ミクを始めとするVOCALOIDと、実況や解説動画。

 

それ以前の音声合成ソフトと違い、初音ミクは「16歳バーチャルシンガー」というキャラ設定を与えられたことで、たどたどしい声が逆に萌えや個性として生かされ、ヒットしたとよく分析されている。

 

その背景を知っているネット民は、動画を見る際にまず「どの音声ソフトのキャラが」「どの方式で声を出すのか」を意識する。

 

ボカロであれば、使ったキャラの名前が動画タイトルの末尾につく。

ゆっくり解説も、どのキャラが話すのか、またはソフトの声を使ってどんなオリキャラを登場させるのかが、サムネイルの段階で分かる。

 

そうして培われたキャラたちのイメージ像が、ユーザー一人一人の中で膨らみ多様性を持ちながら、いくつかの要素により共通の認識を作り上げる。

そうして最近でも、「ポケミク」や「初音ミクEXPO」のように、様々な種類の初音ミクを生み出し、しかし全ては姿が違っても「初音ミク」であるとして企画進行している。

「プロセカ」は、現在若い世代向けにボカロのメインストリームを生み出す存在にまで成長した。かつてのネットとは空気感が違うものの、ボカコレなどのイベントにより未だネット層の注目を引き続けている。いくつかの曲は、TikTokといったニコニコと異なる場所で大ヒットするようになる。

www.project-voltage.jp

 mikuexpo.com

 

プロジェクトセカイ カラフルステージ! feat. 初音ミク (sega.jp)

 

一方で、近年ではキャラの存在しない音声合成が多くなった。

特徴的なケロケロ声だった発音技術は、もはや「神調教」とタグ付けされるまでもなく当たり前に人間と判別できないほどに自然な声となった。

その恩恵は、既にネットを飛び出している。

 

例えばNHKはニュース番組の一部で音声合成を使っているし、街中の無人精算機やアナウンスにもどこかで聞いたことのある音声合成が利用されている。

しかし、そこには一々キャラ性をアピールされることはない。

 

声優が常に名前を名乗ってからナレーションを始めないように。

MOBキャラはあえて名前も顔もかかず、ゲームの進行を妨げない無個性であることを強いられるように。

 

キャラクター付けによって発達したネット内の音声合成は。

今、時代を逆行するように、あえて無個性であるものが増加するという皮肉がこの2023年の現状だ。

声優は一層アイドル化したというのに、音声合成は数こそ毎年多く増えながら、その個性は大御所を除き、大衆に広まったことで個性が薄くなる場面をみかけやすくなる。

 

これは落ちぶれたのではなく、時代の変遷の中にいるのだろう。

 

AIの使用例のニュース

AI技術の発達で、有名人の合成音声が勝手に作られ悪用されるニュースが増えた。

故人の音声合成によるトラブル(元首相や海外の毒舌コメディアン)も多い。紅白で美空ひばりAIが流れたのは2019年だったが、あの時以上に増えている。

特定の政党支持を芸能人がしているよう見せかけたり、ウクライナ侵攻でも嘘の動画と共に使用されるのを見かける。

ネット内でも、無断に音声モデルが販売される一方、著作権整備も対策も行き届いていない。

 

参考

 

「岸田総理に卑猥な言葉を言わせる悪質フェイク動画」 (Full Ver.) - ニコニコ動画 (nicovideo.jp)

AIが声を失ったラジオ記者の声を復元 放送復帰へ=米 - BBCニュース

ディープフェイク動画の衝撃、AIで作られる「高品質なデマ」 写真4枚 国際ニュース:AFPBB News

VTuberや声優の「AI音声モデル」無断販売への懸念 法的トラブルの恐れも - KAI-YOU.net

 

一方で、好意的なニュースもある。

優秀な音声AIが手ごろに、ときに無料で変えるようになってきた。

CeVIO(ちぇびお)も2021年夏に発売されたが、もはやYoutubeで見ない日はないほど広まった。

ビートルズの新曲をジョン・レノンの合成音声AIを用いて完成させた話もある。

About CeVIO | CeVIO Official Site

ビートルズ最後の新曲「Now and Then」は、こうしてAIの技術を駆使して世に送り出された | WIRED.jp

 

日常生活の中で

昔はSafariやコルタナ程度しかいなかった、身の回りの音声認識AIも

多くの家電に搭載されるようになった。

サブスクの発達で、テレビにサブスク用の機器を設置することも多い。

その場合、リモコンで一々文字入力するのが面倒だからと、音声入力する場面も増えてきた。

 

音声認識AIを見ても、サービスの増加がうかがえる。

音声認識AIカオスマップ2024を初公開!生成AI・ChatGPT連携機能の有無や用途が一目で分かる! | 株式会社アイスマイリーのプレスリリース (prtimes.jp)

 

そういえば、電車やバスの音声は録音が多いけれど

初音ミクとコラボした札幌では、アナウンスが一時期ミクのものとなったという報道が2011年にあった。

今では話題性にせずとも、当たり前のように音声AIが街中のサービスに使われているから、時代を感じる。

 

asahi.com(朝日新聞社):車内アナウンスも初音ミク 札幌市電に「雪ミク電車」 - トラベル

 

終わり

今回は、今年爆発的に流行したchatGPTにあえて触れなかったけれど、これと音声AIを結びつけた話もよく聞く。

とはいえ、変わった後では、変わる前のことを思い出せなくなることが多い。

 

初音ミクがシャルル、千本桜、メルトなどと出会う前。

カラオケやCDショップにいつ「ボカロ」ジャンルが設定されたか。

V3やV4、flowerや花譜、ユキが主流に上り詰めるまでの楽曲は何があったか。

 

だからせめて、今日の彼彼女たちはどこに立っているのかを。

自分の狭い視野でいいから記録を取ることで、いつか振り返るときの目印となればいいなと思った。

 

蛇足

ラビットホールのMV、スキなのが多い。

2020年くらいのダーリンダンスくらいから流行り始めた「ぴえん系ソング」の代表格。地雷系、メンヘラ系の創作増えてきたね。

@_CASTSTATION さんのTwitterでみれる無修正verも良いブラックなHさです。

【MMDモーキャプMV】ラビットホール【モーション配布】 - ニコニコ動画

(nicovideo.jp)

 

Pure Pure (youtube.com)