メケメケ

メケメケ

町工場や倉庫がひしめく運河のほとりから、セカイに向けて書き綴るブログ。

インタビュー音源の文字起こしに関する、いくつかの私的ノウハウ【後編】

f:id:yanvalou:20180514063941j:plain

ども。檀原(@yanvalou)です。

さて後半を書こうと思っていたところ、テープ起こしにまつわる面白いイベントを発見したしました。

期日は7月15日(日)。場所は原宿だそうです。

若柳宮音筆の会 特別講「サクラバ姉妹(?)にテープ起こしの奥義を見る」

「かつて働いていた出版社では、政治家や著名人のインタビューのテープ起こしを昔から一手に担ってきた『サクラバ姉妹』と呼ばれているユニットがいる。ただし、ほとんど誰も、彼女らには会ったことがない」……という幻の仕事師ユニットがゲスト講師としてと登場。テープ起こしの奥義を伝授するというものです。

当日のレポート記事を執筆いただけるライターを募集いたします。掲載メディアは未定ですが、原稿料8,500円を音筆の会にて、ご用意いたします。我こそは、という方は、アンケートにてその旨記載ください。

迷わず予約しようとしたところ、なぜか【申込停止中】になっていました(2018年5月14日5:14AM現在)。しかしあと2ヶ月あるので、また受付再開するんじゃないかと期待しつつ……さぁ後半戦に参りましょう。 

グーグル音声入力を使う

昨年あたりからポピュラーになっているのは、グーグル音声入力を使う方法。
2台のスマホ、もしくはスマホタブレットのコンビを用意します。
1台は再生専用。
もう1台は音声入力専用とします(こちらの端末はテキスト入力画面にしておきます)。

  • 1台の端末を Bluetooth(もしくは有線)でイヤホンと接続。
  • インタビュー音源を聞き取りながら、適当なタイミングで一時停止。
  • 聞き取った音声を、もう1台のスマホで音声入力します。
  • 誤入力はあとでまとめて修正。とりあえず最後(もしくは切りが良いところ)まで入力。
  • 仕上げ

という方法です。
多少の変換ミスはありますが、手入力より断然楽ですし、早いです。
今後 AI が進化し音声入力の精度が高まったら、テープ起こし職人は失職でしょうか……。

ここで童話に出てくる小人さんのように、寝ている間に自動処理する方法を編み出した方がいるので、リンクを貼っておきます。

Mac限定で自動化

note.mu

この方法は公開当時Twitterで見つけたのですが、まだ試していません。

というのは、元となる音源が相当きれいでないと使えない方法だと考えられるからです。
会議室やホテルの部屋などでインタビューさせて頂かないとむずかしいでしょう。
つまり法人相手の仕事のときに限定されるのではないかと思います。

とは言えトークイベントやカンファレンスで見かけるようになったUDトーク音声認識技術を使うことによりリアルタイムで字幕を作成する技術。いったん字幕を出した後、人間が補正する)の事例などを見る限り、マイクさえつかえれば場所はあまり関係ないのかも。
もっともマイクをつけた状態でインタビューできることはまずないでしょうから、しずかな場所できれいな音源をとることを心掛けなければならないと思うのです。

音声入力と「きれいな音源」

この「きれいな音源」という言葉をみると、個人的に苦い思い出が甦ってきます。
10年以上前に一度だけテープ起こしを外注に出したことがありました。
当時はまだ、ときどきテープ起こしをしながら記事を書いていたのです。

インタビュー場所は中目黒のフレッシュネスバーガーでした。
相手より早めに来て、ベストな場所とりをして待つのが僕のスタイル。
しかしこのときは早めに到着したにも関わらず、取材相手がさきに来てテラス席で待っていたのです。

テラス席はリラックスして話をするには申し分ないのですが、山手通りは人と車の往来が多すぎます。録音した音源はノイズが耳につきすぎて、テープ起こしがなかなか困難なクオリティーでした。
そういう訳で、面倒くさい作業を外注に出したのです。

当時はまだブログすらなかった時代で、もちろんクラウドソーシングなど影も形もありません。
ですがネット上で呼びかけて「2時間=8千円」という価格で、ボランティアを募りました。
4、5名の応募者があり、そのなかから「元・全国紙の新聞記者」という方にお願いしました。

ふつうはやらないことなのですが、書き起こしの参考にして欲しいと、インタビューのなかで出てくるすべての人物の名前や経歴、主な固有名詞、インタビューの背景などのメモを音源につけて渡しました。

ところが相手は、そのメモをまったく参照していませんでした。
人物名や固有名詞がことごとく間違っていたのです。
メモを付けたのは韓国人やアフリカ人など、聞き慣れない名前の外国人が会話のなかにたくさん出てくるためでしたが、メモをまったく見ていないためにいい加減な名称で書き起こしていたのでした。

それどころか「ノイズが大きいため、ボリュームを名いっぱい上げないと聞き取れない。お陰で夫婦ゲンカになった」などとさんざんクレームを付けてきて、あきらかに聞き取れる箇所も【聞き取り不能】と書いて寄こすような、酷い状態で納品してきたのです。

つまり新聞記者出身といえども、まともにテープ起こしが出来ないライターもいる訳です。

そんなことがありましたので、テープ起こしを外注に出すことは控えています。
逆に自分が仕事として受注することもありません。
苦い思い出です。


最後にテープ起こしを丁寧に書いたブログを紹介して終わります。

ozawashibu.com

もうひとつオマケ。
画像をLINEに送って文字化してくれるサービスです。
グーグルドキュメントに送って文字化する方法は割と有名ですが、LINEでも出来るようになったんですね。

今回の記事は以上です。
またのお越しをお待ちしております。