« prophet-5の接点 | トップ | 発振器三昧 »

シンセで「ア~」

製作中のシンセに、フォルマントフィルター回路をつけて人の声みたいなのが出せないかなと考えています。
原理的に難しいものでは無いので、いかに簡単に作るかがミソかなと思っています。

そこで思いついたのがグライコ用のIC。

店によっては100円そこそこで買える「LA3607」は1チップで7バンドのグライコが作れるのですが、そのうち3バンド分ぐらいを使ってフォルマント周波数と適当な「Q」になるようにコンデンサを付けてあげれば、なんとなく出来そうな気がしてるんですけど・・・。
目標は小学生の遠足のおやつ代(500円)以内?

フォルマント周波数はもちろん女声にあわせるつもりです!?

コメント

私も同じようなネタを温めています(長いこと温めすぎて干からびてきたかも)。Qを可変にしたくてパライコを3発並べようかと考えています。
学生のときは音声合成の研究をしていましたが、コンピュータシミュレーションが主でした。YAMAHAのFM音源チップの音声合成モードでほんのちょっとだけ遊んだこともあります。

やっぱりQをある程度いじれた方が良いのでしょうかね~。
グライコの回路だと、周波数とQが独立して無いので、調整が難しくなるのかな?
S.T.さん音声合成の研究をされていらっしゃったんですね。
個人差だと思いますがフォルマント周波数とか文献やインターネットで調べても、結構バラバラなので・・・その辺の「コツ」があれば、是非教えてくださいませ。

定性的には以下のような感じです。

フォルマント周波数は 声道フィルタの山 で、その山は2個から5個ぐらい現れます。そのピーク周波数を低いほうから順にF1/F2/F3…と呼んでいます。山が明確に現れるのは音韻が母音のときです(あいうえお 等)。
音声をたくさん分析して、フォルマント周波数を抽出してF1, F2, F3 を軸にした空間にプロットすると(多くの文献ではF1-F2だけ選んで平面にプロットしていることが多いです)、だいたい「あ」はこのあたり、「い」はこのあたりといった分布ができます。一人の人の発声でも、微妙にばらつきます(「あーーーーー」と発音していても最初の部分はちょっと「お」寄りとか、終わり部分は「え」寄りとか)。

精密には実際の音声からフォルマントを求めればいいのですが、面倒ですよねぇ… 最近は音声分析ライブラリもフリーで出回っているようですが(あとは SciLabとかのフリーの信号処理ソフト)。

個人差ではもっと大きくばらつきます。日本語5母音の図形で見て、拡大縮小+平行移動 によってAさんの声質からBさんの声質に変換する、っていうのが私の学部のときの研究でした(3年後ぐらいにモーフィングのミュージックシンセが海外メーカで発売されているのを見て、特許をとっておけばよかったと思いました (^^;)。

(ああ、長い。トラックバックにすればよかった)

こんにちわ。
音声/フィルター ネタなのでつい反応してしまいました。
たとえば http://www.optimolch.de/jens.groh/K5000/formants.txt などにもデータがあります。

海文堂から出ている音声の音響分析という本などが読みやすくて参考になるかと思います。

アナログシンセ的には VP330の formant filterあたりがよいですね。

古くは KORG700Sの LPF+HPFでも母音の発音ができました。
K2000のパッチで SAW波OSC+BPF1個で "hellow"と発音するパッチがあります。

通常のLPVCFと 1個のVCBPF(SVFなど)の組み合わせでもある程度楽しめるとは思います。 その際joysticなどを使ってパラメータをコントロールすると有効かと。

S.T.さん、tanakaさん詳細なコメントありがとうございます。アナログシンセの掲示板のネタとした方が良かったかな?

なるほど結構個人差もあるし、1人の声でも微妙に変化するものなのですね。そういう技術を使うと、声のモーフィングも可能なんですね。さすが研究されていただけあって奥が深い。
いろいろ勉強になりました。

tanakaさんのK5000ネタ、探していたのはこれです、これ。
FreqやGain、BW(=Q)がF5までばっちり。これだけパラメータがはっきりしていると、回路的に設計が楽になります。
ソプラノかアルトの「あ」で試して見ようかな。
イメージ的には、お察しの通りVP-330のヒューマンボイスみたいな感じがでればいいんですけど・・・

ところで、こういうネタはS.T.さん的にはPSoCなんかでやっちゃうのかな?

tanakaさん、こんにちは。
K5000のパッチ資料は参考になります。

> S.T.さん的にはPSoCなんかで…
いやいや、PSoCに注目はしていますが、まだいじっていないのです。入手したとしても慣れるまでに時間がかかりそうな気がしています。

RJBさん、STさんこんにちわ。

Q / Freq 可変のBPFが3基あると human voiceの他にViolinのシミュレートにもつかえそうです。
http://www.soundonsound.com/sos/mar01/articles/synthsec.asp?session=c7b45b1161a7649c196ad6ae83f804f7
http://www.soundonsound.com/sos/May03/articles/synthsecrets49.asp?session=c7b45b1161a7649c196ad6ae83f804f7

個人的には MOOGの string filter(39band VC BPF)のまねごとをしたいですね。
http://home.debitel.net/user/jhaible/jh_string_filter.html
JHさんのGICで作った40band filter。  単なる SAW波音源(これはこれで良質ですが)が非常につやのある音に変貌しています。
K5000の 128band formant filterでもできそうな気もします。
-------
PSoCはネタで石だけ買いましたが pastel magicさんのところのlinkを見ると実践されている方もぼちぼち出てきているみたいですね。

tanakaさんどうもです。
なるほど、バイオリンやギターなど、胴が共鳴するような楽器をシミュレーションするには、フォルマント特性を持つようなフィルタは効果的なんですね。
それにしてもJHさんの40bandのフィルターはすごいです。
確かに本物のチェロみたいな響きになってますが・・・ここまでくると、ほとんどアナログ回路では限界?ですね。
さらにプログラマブル対応にさせようと考えると、完全にDSPとかPSoCとかを使った方が楽そうな気がします。
今日LA3607(千○電商で110円)をゲットしました。この石は7バンドですが原理的にはGICを応用してますので、遊べるかな?
他にもJHさんすごいものをたくさん作られていて、いいサイトを紹介していただきありがとうございました。

« prophet-5の接点 | トップ | 発振器三昧 »