無料で始める

文字起こし
ボイスレコーディング音声・動画YouTube動画音声ファイル動画ファイルMP4動画ZoomミーティングMicrosoft TeamsGoogle Meetインタビューポッドキャスト講義TikTok動画WhatsApp音声ボイスメモMP3ファイル電話通話説教
をテキストに。 数秒で

話者ラベルとAIサマリー付きのクリーンな文字起こしを、リアルタイムよりも高速に取得。

音声または動画をドロップ

MP3 · MP4 · WAV · M4A · MOV · 1ファイル最大10時間

リンクを貼り付けるだけで音声を取得

YouTube・TikTok・Vimeo・Twitter・SoundCloud・Spotify・他50以上

ブラウザから直接録音

サインアップは30秒 — その後すぐにダッシュボードで録音が開始されます。

無料 30 min/moカード登録不要100+ 100以上の言語話者ラベル(Pro以上)ファイルは24時間後に自動削除

無料プラン:月30分、1ファイル最大30分。カード不要。

100+
言語の自動検出
自動検出、手動で上書き可能。
95%+
クリーンな音声の精度
主要言語、1~2名の話者。
10h
ビジネスプランの最大ファイル長
Proで10時間・Freeで30分。
~30×
リアルタイムより高速
60分のファイルが通常2~3分で完了。
これがダッシュボードです

あちこちクリックしてみてください。 実際のものです

タブは動作します。アクション項目の切り替えも可能。これはジョブ完了後にアカウントに表示されるものとまったく同じです — 同じレイアウト、同じコントロール。

app.transcription.solutions / jobs / interview-ari-2026-04-26

サマリー

自動スナップショット · saved
TL;DR

創業者が必要としているのは通話後のコンテンツであって、単なる文字起こしではありません。現在のツールでは5つのアプリをつなぎ合わせる必要があります。

318words2話者 · 58 / 425トピック

キーポイント 3

  • 01生の録音と出荷可能なコンテンツの間にギャップがある
  • 02ショーノート、ソーシャルクリップ、ブログ下書き — 通話終了までに求められる
  • 03現在のツールは5つ以上のアプリに分散

アクション項目 2

  • 5アプリのつなぎ合わせに代わる単一パイプラインアプローチを調査
  • この文字起こしからショーノートの下書きがどのように見えるかモックアップ
トピック創業者のワークフロー通話後のコンテンツツールの断片化ショーノート単一パイプライン

話者分離された文字起こし

4行 · 2名の話者 · 30秒クリップ
00:12話者A創業者からよく聞くのは、生の録音と実際に出荷できるコンテンツの間のこのギャップです。
00:27話者Bまさに。誰もまた文字起こしを欲しがっていません — 通話が終わるまでにショーノート、クリップ、ブログ下書きが欲しいのです。
00:41話者Aそうです、そして現在のツールはそれを実現するために5つのアプリをつなぎ合わせることを強制しています。
00:54話者B1つのパイプライン、1つの場所。それが賭けです。

話者分析

ステレオチャンネル分割 · モノラルの話者分離
話者A
発話時間58%
2
Turns
14s
発話時間
…生の録音と実際に出荷できるコンテンツの間のこのギャップ。
話者B
発話時間42%
2
Turns
10s
発話時間
1つのパイプライン、1つの場所。それが賭けです。

エクスポート形式

すべてのプラン、すべての形式 · 7つの出力 · 透かしなし · TXT · SRT · MD · JSON · VTT · DOCX · PDF
TXT

プレーンテキスト

クリーンなテキスト出力 · 全プラン

SRT

SubRip字幕

タイムスタンプ付き字幕 · 全プラン

MD

Markdown

話者ヘッダー+サマリー · 全プラン

JSON

構造化JSON

公開スキーマ · APIワークフロー向け · 全プラン

VTT

WebVTT字幕

HTML5ビデオプレーヤー形式 · 全プラン

DOCX

Word文書

話者ヘッダー+タイムスタンプ · 全プラン

PDF

ブランド付きPDF

印刷対応 · サマリー&話者 · 全プラン

デモ · ミュート
0:18 / 1:00
サンプル出力 · ポッドキャストクリップ30秒

1つのファイル。 8つの成果物

任意の出力にホバーまたはタップすると、実際の見た目を確認できます。中央に同じ30秒のポッドキャストクリップが表示され、そこから8つの成果物が生成されています。

文字起こし

句読点付き · タイムスタンプ付き

00:12 話者A
創業者からよく聞くのはこのギャップ…
AIサマリー

要約 · キーポイント

創業者が必要とするのは通話後の コンテンツ、単なる文字起こしではありません。ツールは5つのアプリをつなぎ合わせることを強いています。
話者

話者分離 · Pro以上

2人通話はステレオチャンネル分割。それ以外はモノラル話者分離。
100以上の言語

自動検出

研究レベルのASR。自動検出が誤った場合は特定の言語を強制可能。
interview-ari-2026-04-26.mp3
30秒クリップ · 2名の話者
100以上の言語 · 自動検出 · 95%以上の精度
文字起こし · 30秒ウィンドウ
00:12
A創業者からよく聞くのはこのギャップです。
00:14
A通話が終わり、実際の作業が始まります。
00:18
Bそうです — 通話後の作業に一日が費やされます。
00:21
Aツールは文字起こしが成果物だと思い込んでいます。
00:24
Aそれは入力です。
00:27
Bだから手作業で5つのアプリをつなぎ合わせるのです。
AIサマリー
要約: 創業者が必要とするのは通話後の コンテンツ、生の文字起こしではありません。今日のツールは5アプリのワークフローを強制します。
キーポイント
  • 文字起こしは成果物ではなく入力
  • アクション項目は生テキストに勝る
  • 単一パイプラインはSaaSのつなぎ合わせに勝る
話者分離 · 2名の話者を検出
話者A
話者B
0:000:150:30
ステレオチャンネル分割 · 発話比率62% / 38%
言語検出
英語 (en-US)99.2%
その他の候補
en-GB 英語 (イギリス)0.6%
en-AU 英語 (オーストラリア)0.2%
アップロード時に検出 · いつでも上書き可能 · 100以上の言語
エクスポート · 7形式 · 透かしなし
TXT interview-ari-2026-04-26.txt34 KB
SRT interview-ari-2026-04-26.srt52 KB
VTT interview-ari-2026-04-26.vtt51 KB
MD interview-ari-2026-04-26.md38 KB
JSON interview-ari-2026-04-26.json71 KB
DOCX interview-ari-2026-04-26.docx91 KB
PDF interview-ari-2026-04-26.pdf146 KB
URL取り込み · 1500以上のサイト対応
youtube.com/watch?v=Hk8L4mD2pXv
メタデータ取得0.3秒
音声ダウンロード4.2 MB
音声抽出ステレオ · 44 kHz
ASRキュー
REC00:42 / 60:00
iPhoneのSafari · デスクトップのChrome
60分で自動停止 — より長いファイルはアップロード
ジョブステータスライブ
アップロード0:08
音声抽出0:02
ASR · AssemblyAI U-247%
話者分離キュー待ち
AIサマリーキュー待ち
エクスポートレンダリングキュー待ち
ステータスを段階的にプッシュ · リフレッシュ不要
エクスポート

7形式 · 透かしなし

TXTSRTMDJSONVTTDOCXPDF
URL取り込み

YouTube · TikTok · Instagram

任意の動画リンクを貼り付け。一度ダウンロードして文字起こしし、ソースは破棄。
ブラウザ録音

iPhone Safari · Chromeのマイク

録音を押して、話して、停止。アプリインストール不要。1録音最大60分。
リアルタイム進捗

WebSocketジョブステータス

アップロード→ASR→話者分離→完了までのライブステータス。ポーリング不要、盲目的な待機不要。
誰が使っているか

実際に作業を行う人々のために作られました 実際に作業を行う

毎週見られる3つのパターン。パイプラインは変わりません — その後に何を出すかが変わります。

01ポッドキャスター

エピソード ショーノート 納品

長いインタビューが5行のサマリー、4つの章、話者ラベル付き文字起こし、短尺クリップ用のSRTになります — 1つのジョブで、実際に出荷するすべての出力。

7形式TXT · SRT · MD · JSON
VTT · DOCX · PDF
02研究者

長時間インタビュー、 タイムスタンプ引用

2つの音声による3時間のZoom録音をエンドツーエンドで処理。Proでは話者分離。DOCXエクスポートからタイムスタンプで引用。もう「あれはどこで言ってたっけ…」とスクラブする必要はありません。

95%+ASR精度
クリーンな音声で
03小規模チーム

録音 アクション項目 担当者

自動参加なし、カレンダー権限なし、「会議内のエージェント」なし。録音をドロップして文字起こしを共有。アクション項目を抽出、命名、トリアージ準備完了。

2,500月間分数
ビジネスプラン
受け付ける入力

ファイルをドロップ、リンクを貼り付け、
またはAPIを呼び出す

6つの入力方法、実際に稼働中。各ピルは本番環境で現在稼働している実際の取り込み経路です。

YouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooksYouTubeTikTokInstagramDirect media URLPublic REST APIWebhooks
料金

プラン
実際にフィット

すべてのプランに話者分離品質のASRが含まれます。上位プランではより大きなファイル、キューの優先順位、AIサマリーが利用可能。

月額年額 −50%
Free
$0永久に
カード不要 · トライアル期限なし

試用、時々の単発使用、短いクリップに。

  • 月30分
  • 1ファイル最大30分
  • 7つのエクスポート形式 · 透かしなし
  • 低優先キュー
無料で始める →
メール確認が必要
最も人気
Pro
$19$19/月
いつでもキャンセル可能 · 超過$0.04/分

インタビュー、ポッドキャスト、または繰り返しの長尺作業を行う方に。

  • 月600分
  • 1ファイル最大60分
  • 話者ラベル+AIサマリー
  • アクション項目+トピックタグ
  • 「読みやすく」段落整飾
  • 翻訳 · Webhook配信
  • 標準キュー優先順位
Proを選択 →
超過$0.04/分 · いつでもキャンセル可能
ビジネス
$49$49/月
いつでもキャンセル可能 · 超過$0.02/分

チーム、代理店、大量処理を行う運用担当者向け。

  • 月2,500分
  • 1ファイル最大4時間
  • Proのすべて · 月50翻訳
  • 高優先キュー
  • 公開REST API · キーごとのレート制限ティア
  • 優先メールサポート
ビジネスを選択 →
超過$0.02/分 · いつでもキャンセル可能

年払いで節約 50% · 返金ポリシー · Freeはカード不要

同じ音声 · 2つの出力

Freeは単語だけ。
Proは成果物を提供。

同じ音声、同じモデル。違いは文字起こし完了後のすべての処理です。

Freeの出力

創業者からよく聞くのは、生の録音と実際に出荷できるコンテンツの間のギャップです。まさに、誰もまた文字起こしを欲しがっていません。通話が終わるまでにショーノート、クリップ、ブログ下書きが欲しいのです。そうです、そして現在のツールはそれを実現するために5つのアプリをつなぎ合わせることを強制しています。1つのパイプライン、1つの場所。それが賭けです。このパターンを数ヶ月見てきました — 音声はクリーンに入ってきますが、下流のワークフローはNotionとOtterとZapierの間のスクリーンショットとコピーペーストでつながれていて、そして 通話が終わり、締切が20分後に迫っているときに別のタブで開いているその他何でも…

プレーンな文字起こし話者ラベルなしサマリーなし7形式すべて

次へ: どこかに貼り付け、構造化し、自分でサマリーを書き、手動でアクション項目を抽出。

Proの出力
TL;DR

創業者が必要とするのは文字起こしではなく、後処理です。1つのパイプラインは5つのアプリをつなぎ合わせるよりも優れています。

00:12 話者A創業者からよく聞くのは、生の録音と実際に出荷できるコンテンツの間のこのギャップです。
00:27 話者Bまさに。誰もまた文字起こしを欲しがっていません — 通話が終わるまでにショーノート、クリップ、ブログ下書きが欲しいのです。
00:41 話者Aそうです、そして現在のツールはそれを実現するために5つのアプリをつなぎ合わせることを強制しています。
00:54 話者B1つのパイプライン、1つの場所。それが賭けです。
アクション項目 · 2
  1. 統合パイプラインを試す — 音声入力、ノート&エクスポート出力、1つのジョブ。
  2. 次の通話までにOtter + Notion + Zapierのスタックを置き換える。
要約 · 1行話者 · 話者分離済みアクション項目 · 2「読みやすく」整飾

次へ: 要約をSlackにコピー、DOCXをメールに添付、クリップを出荷。通話ノートが冷める前に完了。

— 同じ音声 · 同じモデル · 違いは後処理に —

実際の使用例

ユーザーが 黙っていられない about

ほど

MR
Maya Reyes
@mayarcuts · ポッドキャスター

ポッドキャスターは1エピソードを納品するために5つのタブを開く。 1ジョブで — ショーノート、文字起こし、クリップ対応SRTが出力。以上。

4月18日1ジョブで
DA
Dr. Diego Alarcón
@diegoalarcon · 研究者

14件の長時間インタビューを話者分離で処理。 DER 0.95 クリーンな音声で実現。DOCXエクスポートをそのまま論文草稿に。

4月22日DER 0.95
SO
Sora Okafor
@sorawrites · ライター

26件のボイスメモ。3つのTikTok URL。ニュースレター下書きのアウトラインが 11分。Otterでそれを超えてみてください — 待ってます。

4月19日11 min
MR
Maya Reyes
@mayarcuts · ポッドキャスター

ポッドキャスターは1エピソードを納品するために5つのタブを開く。 1ジョブで — ショーノート、文字起こし、クリップ対応SRTが出力。以上。

4月18日1ジョブで
DA
Dr. Diego Alarcón
@diegoalarcon · 研究者

14件の長時間インタビューを話者分離で処理。 DER 0.95 クリーンな音声で実現。DOCXエクスポートをそのまま論文草稿に。

4月22日DER 0.95
SO
Sora Okafor
@sorawrites · ライター

26件のボイスメモ。3つのTikTok URL。ニュースレター下書きのアウトラインが 11分。Otterでそれを超えてみてください — 待ってます。

4月19日11 min
JV
Jules Verstappen
@julesverops · 運用

Webhookとアクション項目抽出で週次の振り返り文書が不要に。全体のループは 2分 に。

4月23日2分ループ
RK
Rohan Kapoor
@rohan_legal · 顧問弁護士

宣誓証言録音 → 話者分離文字起こし → 引用付きPDF。以前は海外に外注していた。今は 1回のアップロード.

4月24日1アップロード
EM
Elena Marchetti
@elenamarch · 営業

イタリア語の営業通話 → 英語のサマリー。私のチームは ついに読んでくれる。小さな詳細、大きな影響。

4月27日IT → EN
JV
Jules Verstappen
@julesverops · 運用

Webhookとアクション項目抽出で週次の振り返り文書が不要に。全体のループは 2分 に。

4月23日2分ループ
RK
Rohan Kapoor
@rohan_legal · 顧問弁護士

宣誓証言録音 → 話者分離文字起こし → 引用付きPDF。以前は海外に外注していた。今は 1回のアップロード.

4月24日1アップロード
EM
Elena Marchetti
@elenamarch · 営業

イタリア語の営業通話 → 英語のサマリー。私のチームは ついに読んでくれる。小さな詳細、大きな影響。

4月27日IT → EN
TN
Tomi Nakamura
@tominaka · 翻訳者

日本語の自動検出 そのまま使える。ただし、このサイトのセリフ斜体は無関係なデザイン犯罪ですが、私は尊重します。

4月21日自動検出
PL
Priya Lakshmi
@priyalbuilds · 創業者

REST API + キーごとのレート制限 = 社内ボイスメモパイプライン。所要時間 30分 で配線。チーム全体で月額$19。

4月25日月額$19
FA
Fatima Al-Rashid
@fatima_writes · ジャーナリスト

24時間自動削除は、私が 欲しいと思っていなかった機能 競合他社のプライバシーページを確認するまでは。

4月26日24時間削除
TN
Tomi Nakamura
@tominaka · 翻訳者

日本語の自動検出 そのまま使える。ただし、このサイトのセリフ斜体は無関係なデザイン犯罪ですが、私は尊重します。

4月21日自動検出
PL
Priya Lakshmi
@priyalbuilds · 創業者

REST API + キーごとのレート制限 = 社内ボイスメモパイプライン。所要時間 30分 で配線。チーム全体で月額$19。

4月25日月額$19
FA
Fatima Al-Rashid
@fatima_writes · ジャーナリスト

24時間自動削除は、私が 欲しいと思っていなかった機能 競合他社のプライバシーページを確認するまでは。

4月26日24時間削除
よくある質問

よくある質問 実際に ask

文字起こしの精度はどのくらいですか?+

クリアな音声で1~2名の話者の場合、主要言語で95%以上の精度に達します。背景ノイズ、強いアクセント、または重なり合った発話では品質が低下します。

対応言語は?+

100以上の言語に対応し、自動検出可能。自動検出が誤った場合は特定の言語を強制することもできます。UIは英語のみ — 多言語インターフェースは計画中です。

ファイルの保存期間は?+

ソースメディア(アップロードされた音声/動画)は文字起こし完了後24時間以内にインフラから削除されます。文字起こしとサマリーは削除するまで、またはアカウント削除後30日間アカウントに残ります。音声認識プロバイダー(プライマリ: AssemblyAI、フォールバック: OpenAI)は独自の保持ポリシーに従って音声を処理します。詳細は /privacy にサブプロセッサの完全なリストがあります。

録音を使用してモデルを訓練しますか?+

いいえ。当社のASRプロバイダーは有料エンドポイントでデフォルトでトレーニングオプトアウトされています — 当社はそれらを使用しています。当社は何も追加しません: お客様の文字起こしで訓練された独自モデルはなく、シャドウ分析もありません。

ジョブが失敗した場合はどうなりますか?+

分数は差し引かれません。ほとんどの失敗(プライベートURL、ファイルが長すぎる、サポート外のコーデック)には明確なエラーメッセージと再試行のガイダンスが付属します。

キャンセルはできますか?+

はい — Stripeカスタマーポータルでいつでも可能です。有効期間中はプランが維持され、次の更新日にFreeにダウングレードされます。

返金ポリシーは?+

プランの分数の10%未満しか使用していない場合、7日以内に全額返金。その後は未使用分の日割り返金。[email protected] にメール。

APIはありますか?+

はい — REST APIは稼働中、Webhookも利用可能。APIキー認証は近日対応予定。プランごとのレート制限。アカウント作成後、/docs/api にドキュメントがあります。

セキュリティとプライバシー

退屈なことですが、 対応済み

SOC 2ステッカーはありません。まだ出荷していないコントロールにはバッジを付けません。

100%
自動削除
ソースファイルの24時間以内の自動削除、毎回
0
トラッカー · 広告 · 再販
あなたの音声がモデルの訓練に使用されることは決してありません
1×
クリックして削除
アカウントと全データを30日以内に消去

ソースファイルは24時間で消去

アップロードした音声と動画はジョブ完了後24時間以内に消えます。厳格な契約であり、設定ではありません。

データによる訓練はなし

上流のASRプロバイダーはデフォルトで訓練オプトアウト — 当社はそれらのエンドポイントを使用。当社は何も追加しません。

AES-256 + TLS 1.3

保存時および転送中の暗号化、初日から。HSTSを強制。

GDPR準拠

EUのアクセス/削除/データポータビリティ権を尊重。DPAはリクエストに応じて。

ワンクリック削除

設定 → アカウント削除。全データを30日以内に消去。サポートチケット不要。

サブプロセッサ一覧

目的別の完全なベンダーリスト: /privacy。予期しないベンダーはありません。

— 準備はいつでも

ファイルをドロップ。
取得 文字起こし
コーヒーが冷める前に

月30分無料、1ファイル最大30分。クレジットカード不要、トライアル後のカード不要、アスタリスクなし。いつでもワンクリックでプランキャンセル可能。

月額無料30 min
言語100+
エクスポート形式7
MP3MP4WAVM4AMOVMKVWEBMYOUTUBETIKTOKINSTAGRAMブラウザ録音