今日はこんなものを作っていました。

「Vibe Voice」という、音声を自動で書き起こしてくれるWebアプリで、僕が今まで書いてきたことを読み込ませているので、思想や特徴などを僕っぽくしてくれる、自分専用の音声書き起こしアプリです。ですのでRAG的な感じもあります。

本日は全くそんな予定では無かったんですが、一度作り出すと止まらないし、止めたら止めたで作り上げなくなってしまうし、そもそもこうしたツールはどのみち必要だなー…なんてことを考えていたので、即興とノリで作ってみたというわけです。

もちバイブコーディングで。

誰もが使えるように公開するのも面白いと思いますが、API挿さないと使えないシステムなので、公開してもね…ってことで一先ず自分専用にしています。(こんな自分専用システム欲しいって人はお気軽にご連絡を)

システムはNext.jsでVerselにデプロイと、最近僕が主流としている方法で構築しています。

で、テストがてら軽く使ってみましたが、結構いい感じに読み込んでくれるので、これから使い込んでブラッシュアップしてきたいと思っています。

というのも、僕は音声を録るという行為、喋るという行為が非常に苦手でして、もう今の時代や僕のAIスキルを考慮するならどう考えても音声ライティングが良いのですが、いかんせん音声を扱うのが苦手なんです。

ってことで今も普通にタイピングで書いていまして、それぐらい苦手なので克服したいと思っているのです。

なんと言っても僕は吃音持ちです。いわゆる「ドドドドド…」などと吃ることはありませんが、会話がうまく出来ない瞬間や、言葉が瞬時に出てこないことがあったりして、子どもの時から喋ることが本当に苦手で45年間生きてきているのです。

人前でのプレゼンなんかもすっごい苦手なので、そんな時は猛練習してから挑みます。

昔、小学生ぐらいの時に母親が公園にあった電話ボックスに行き、自宅に電話をかけてきて、僕が取って喋るという練習をしたことがありましたが、なんというかそれぐらい喋るのが苦手だったんです。普通に会話は出来るんですよ。でも構えたりすると出来ないって感じで。これは僕のように喋るのが苦手な人にしか分からない感覚だと思います。だから、おしゃべりの人が昔から羨ましかったですね(兄がおしゃべりでww)。

そんなわけで、近い将来ポッドキャストも始めたいと思っていますし、音声を使ってこうして文章コンテンツもバンバン発信してきいたい。だったら自動化して作りやすくしたほうがいいじゃん!ってことで作ってみたというわけです。

というのも、最近こうしてバンバン自分でシステム開発をしているし、これからも開発したいものも結構あるんですよね。 

例えば「血液検査を解析できるシステム」で、コードネーム『24DaVinci』。これは僕が行っているパーソナルヘルスケアサービスの加入者がそれなりに増えてきたら開発を進めようと思っていたりしまして、そうした「開発ヒストリー」 なんかもライトに音声や文章でお伝えしていきたいと考えているのです。

当然失敗などもあるわけで、日々トライ&エラーなわけです。Vibe Voiceもそれなりにエラーがあり、それを乗り越え作り上げました。

そうした様子などを僕自身が楽しみ、かつその時のトレンドや価値ある情報などを織り交ぜつつ届けることができたらなと考えているのです。

そのためには音声のトレーニングと数を熟すこと、と思い自作で音声書き起こしアプリを作ったってわけです。

Obsidianを使って…なんてことも考えましたが、一先ずこちらで音声トレーニングがてら発信していきたいと思います。


そして僕のメインの仕事は映像制作で、複業的にパーソナルヘルスケアサービスやシステム開発も進めている昨今です。