OpenAIAudioコンポーネントは、OpenAI社が提供しているAI機能と連携するコンポーネントです。OpenAIAudioは入力された音声ファイルから文字起こしを行う機能を呼び出すことが出来ます。
※このOpenAIAudioコンポーネントを使用するにはOpenAIのAI機能を呼び出すためにAPI Keyを予め取得する必要があります。OpenAIのサイトでAPI Keyを取得する方法につきましては こちら を参照してください。
コンポーネントプロパティ
プロパティー名 | 説明 | 例 |
---|---|---|
基本プロパティ | 「OpenAI」カテゴリーの基本プロパティを指定します | |
API Key | API Key *1 | |
Organization Id | 組織ID *1 | |
User | ユーザー名 | |
Operation | 処理を 文字起こし 翻訳 から選択します | Transcribe Translation |
Model | 使用するモデル名を選択または手入力 | Whisper-1 |
Audio File | 音声ファイル名 | |
Language | 音声の言語 ISO-639-1形式で指定します。デフォルトは英語です | ja en |
Prompt | プロンプト | |
Temperature | サンプリング温度 0〜1 で指定します | |
Response Format | 出力データフォーマットを JSON 詳細なJSON テキスト SRTファイル VTTファイル から選択します | JSON Verbose JSON Text srt vtt |
※ OpenAI関連の各プロパティの詳細は OpenAI APIリファレンス を参照してください。
※1 OpenAIAudioコンポーネントを使用するには、API keyを取得する必要があります。API keyの取得方法につきましては こちら を参照してください。
出力のペイロード
出力ペイロード | 説明 |
---|---|
cv.Payload |
Response Format プロパティ 出力データフォーマットで指定した内容を格納します |
Need more help with this?
Join our slack community for help