音声処理

rnnoise を使って展示会の録音ファイルから音声以外のノイズを消してしまおう

テレビ会議は議事録をとる代わりに録音 他の記事でも散々書いておりますように、筆者は議事録をとる代わりに全ての会議を録音することを推奨しております。普通の会議では合意事項として「要点」と「次のアクション」をそれぞれ3行くらいずつ残しておけば十...
画像処理

AIで救急車のサイレン音を解析し救急車の往来回数をカウントしよう(3) Raspberry Piでリアルタイムのサイレン音分類

前回までの記事で、画像分類に使われるVGG16というアルゴリズムを使うことで、救急車・消防車のサイレン音を10秒ごとに識別することができるようになりました。 AIで救急車のサイレン音を解析し救急車の往来回数をカウントしよう(1) AIで救急...
画像処理

AIで救急車のサイレン音を解析し救急車の往来回数をカウントしよう(2) VGG16のファインチューニングによる分類

この記事は3回の連載記事です。こちらもご覧ください。 AIで救急車のサイレン音を解析し救急車の往来回数をカウントしよう(1) AIで救急車のサイレン音を解析し救急車の往来回数をカウントしよう(3) 前回と今回の記事の内容 前回の記事では、我...
2021.10.19
画像処理

AIで救急車のサイレン音を解析し救急車の往来回数をカウントしよう(1)

救急車うるさーい! のっけから不満でスタートしましたが、私は都内に住んでいて、それも救急病院の近くという、自分が急病になるリスクを考えると最高に安心な場所に住んでいます。しかし、当然のことながら、自分だけでなく他人も急病になるわけでして、そ...
2021.10.19
セットアップ方法

Raspberry Pi 4B に Ubuntu OS を入れてTensorflowをインストールしてみよう

Raspberry Pi(ラズベリーパイ、略してラズパイ)を初めて触った時は軽い衝撃でした。数年前「え? ラズベリーパイを知らない? (あなた、信用して大丈夫ですか?)」とお客様に驚かれたので、ちょっと調べてみたところ「なんじゃこりゃー」と...
自然言語処理

FESSをインストールしてスクショ画像を検索しよう

今回のお題「スクショ画像をFESSで検索」 「画像を検索する」というとGoogleの画像検索をイメージする人が多いでしょうか? インターネット上での画像の検索は、通常、Webサイト上の画像周辺の文章を検索して画像を拾ってくるものです。 しか...
画像処理

大量のスクショ画像を無料OCRで文字起こしして、後から検索できるようにしよう

オンラインのセミナー・会議はスクショで忙しい コロナが流行してから生活スタイルが大きく変わりました。ただ、一部のサラリーマンにとってはテレワークが認められるなど、まんざら悪いことばかりとも言えない状況です。  中でも会議のスタイルは大きく変...
音声処理

会議の録音ファイルを音声認識して議事録を作る?

会議を録音した音声ファイルを「音声認識エンジン」にかけて、テキストファイルとして議事録を出力させようと考えたことがある人は多いと思います。DXのターゲットとしても、無駄な作業の撲滅という観点では非常に魅力的です。 「議事録を書く」と...
セットアップ方法

Google Cloud Platform (GCP) アカウントの開き方

こちらのページで「無料で開始」ボタンを押します。 GCPエントリー画面 Gmailなどで利用するGoogleのアカウントは既に持っているという前提で進めます。もし持っていなければ作成してください。以下のようなログイン画面が出る...
タイトルとURLをコピーしました