話し手を正確に聞き分ける文字起こし

テープ起こしに加えて、IC起こし、動画起こしとも言われる「文字起こし」の作業では、発した言葉を正確に聞き起こすことはもちろん大切ですが、複数人が登場する会議や座談会などでは、それぞれの声を聞き分けることも大事な要素となります。

HINA.は、声の聞き分けを得意としています。ICレコーダー(ボイスレコーダー)起こしでも、動画起こしで顔が映っていなくて音声だけでも、それぞれの声質によって話し手を聞き分けていきます。

その秘訣は、まず初めに、会話の内容をつかみ、その流れを正確に理解すること。

次に、登場人物の声のイメージをつかむこと。声のイメージに関わる要素は、性別と年齢に加えて、声質、音程、間の取り方、アクセント、地域(方言)、癖言葉、職業などがあります。男性と女性では声質と音程などのトーンが全く違うので、まずここで大きく二分されます。その次に、年齢。年齢によって違うのは音程です。若い人は比較的高いのに比べて、中年以降は低くなり、壮年・老年と行くにつれて、次第にしゃがれた感じが加わっていきます。声を扱う職業では、声が年を取らず衰えない方もたくさんいらっしゃいますが、それでも年齢による声の違いはどなたでも感じることが多いのではないでしょうか。

文字起こしの作業場面では、事前資料として話者のお名前を伺うことはあっても、有名人以外で年齢まで知り得ることは少ないと思います。あくまでも声を聞いた感じのイメージにすぎません。ですから、想像の域を出るものではありませんが、声を識別するポイントとして年齢をイメージすることは大変効果的です。

そして方言やアクセント。これは、生まれた場所、または今までに住んだことのある地域の言葉ですが、現在、住んでいる地域の影響が出やすい傾向にあります。県議会や市議会など周辺地域の参加者が多い場面では、ほとんど全員が同じ地域の方言を話すことになります。また会議や座談会などの内容によっては、中年以降の方がほとんどであったり、若者だけであったり、女性だけ、または男性だけの参加者ということもあります。

このように、年齢、性別、住んでいる地域が似ているという条件下ではどう聞き分けるのでしょうか。残りの聞き分ける要素として、それぞれが持って生まれた声質と音程、そして声の強弱、間の取り方、なぜか何度も発してしまう癖言葉があります。たまに、そっくりな声質で、しかも話し方も似ている人が2名いて、実際その聞き分けに多少苦しむことはあります。でも、それは本当にごく稀で、HINA.では、声の判別は「ほぼ可能」と思っています。

ここで声の判別は「ほぼ可能」と申し上げたのは、残念ながら100%とは言えないからです。区別がつきにくい点は、発言が極端に短くて少ない話者です。短い発言では、その人の声の特徴がどうしても出にくくなります。二言、三言の発言で、しかもほんの数秒だけの人の判別は、それだけでは少しあやふやなものです。ですが、その場にいる人数から特定できた人を差し引き、そして残った人がほんの少し発言した人の可能性が高くなります。逆に、あまり発言しない人がたくさんいる場合、その声の判別は大変難しいものとなります。

このように性別の偏りが見られ、年齢・地域の条件が似かよっている場合には、「発言メモ」が役に立ちます。発言した人の名前と発言内容をごく簡単にメモしたものです。大まかな内容、または話の冒頭の5文字程度でも十分です。簡単に発言順に名前を書いた「発言者メモ」もとても有効となり、確実な聞き分けに近づいていきます。

 

Comments are closed.

Post Navigation