OpenAIAudioコンポーネントは、OpenAI社が提供しているAI機能と連携するコンポーネントです。OpenAIAudioは入力された音声ファイルから文字起こしを行う機能を呼び出すことが出来ます。

※このOpenAIAudioコンポーネントを使用するにはOpenAIのAI機能を呼び出すためにAPI Keyを予め取得する必要があります。OpenAIのサイトでAPI Keyを取得する方法につきましては こちら を参照してください。

コンポーネントプロパティ

プロパティー名 説明
基本プロパティ 「OpenAI」カテゴリーの基本プロパティを指定します
API Key API Key *1
Organization Id 組織ID *1
User ユーザー名
Operation 処理を 文字起こし 翻訳 から選択します Transcribe Translation
Model 使用するモデル名を選択または手入力 Whisper-1
Audio File 音声ファイル名
Language 音声の言語 ISO-639-1形式で指定します。デフォルトは英語です ja en
Prompt プロンプト
Temperature サンプリング温度 0〜1 で指定します
Response Format 出力データフォーマットを JSON 詳細なJSON テキスト SRTファイル VTTファイル から選択します JSON Verbose JSON Text srt vtt

※ OpenAI関連の各プロパティの詳細は OpenAI APIリファレンス を参照してください。
※1 OpenAIAudioコンポーネントを使用するには、API keyを取得する必要があります。API keyの取得方法につきましては こちら を参照してください。

出力のペイロード

出力ペイロード 説明
cv.Payload Response Format プロパティ 出力データフォーマットで指定した内容を格納します

Need more help with this?
Join our slack community for help

お役に立ちましたか?

はい いいえ
お役に立ちましたか
理由をお聞かせください
フィードバックありがとうございました