Transkrizjoni ta' intervisti.Rekordjazzjoni differenti, riżultat ugwali.

Phone memo, Zoom call, lavalier rig, jew handheld field recorder — azzjonx ir-rekordjazzjoni tal-intervista u rċievi test b'etiketti tas-speaker u timestamps li tista' tqot minnha.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Ara x'joħroġ

Żewġ ħsejjes ta' dħul. Żewġ ħsejjes ta' ħruġ, b'etiketta.

Ħafna intervisti huma żewġ persuni fuq device waħda — telefown fuq it-tabella, rekordjatur bejniethom. Aħna nifirdu l-audio tal-intervista bejn ir-reporter u s-sors s'minn kanali mono wkoll, imbagħad napplikaw timestamps għal kull dmir għall-ħtieġ tal-quotazzjoni.

Field recorder · WAVREC 2 speakers · 38:42
auto-detected en-US48 kHz mono · 1411 kbps
~90s
Transcript · streaming94% accuracy
S1

Tistax tmur minn xi smajt fil-bieraħ tal-18?

S2

Wasalt madwar is-sitta. Id-dahar tal-loading bay kien diġà miftuħ, li m'kellix jkun.

S1

U rrapportajt il-problema tad-dahar qabel — lil min?

S2

Lil Diane Okafor fil-facilities, darbtejn f'Marzu. Għandi l-emails.

94% fuq field WAVDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Tliet għażliet reali · paraguni onest

Rev human. Otter jew Trint. Jew mingħandna.

Rev jibgħat l-audio tiegħek lil human transcribers — bil-ħin u għali imma b'fidelità għolja fuq audio diffiċli. Otter u Trint huma AI-first bħal mingħandna, ifittrex għal ġurnalisti u riċerkatur. Hawn fejn ivvinta kull waħda.

Option 01

Rev human transcription

Nies veri jiktibu l-intervista tiegħek. Aħjar fuq hostile audio, imma inti mostennija u tħallas.

Turnaround12–24 siegħa tippiċi
Accuracy fuq clean audio99% (iddikjarat)
Speaker labelsManual, inkluż
LingwiEN human · 30+ AI
Spiża · per min$1.50 human · $0.25 AI
PrivacyAudio mandate lil contractors
Best forIntervisti ggwidata mill-qorti jew li huma kritiki għall-pubblikazzjoni fuq audio ħażin fejn għandek bżonn widna uman u għandek ġurnata biex tistenna.
Option 02

Transcription.Solutions

AI transcript, speaker-split, mir-reżultat fi minuti. L-istess engine għal phone memo, Zoom, jew field recorder.

Turnaround~3 min għal kull siegħa ta' audio
Accuracy fuq clean audio94–96%
Speaker labelsAuto · irebbu fl-editor
Lingwi99, auto-detected
Spiża · per min$0.03
PrivacyAudio eliminat fi 24h · għal training l-ebda
Best forĠurnalisti, riċerkatur, u produtturi li jagħmlu intervisti multipli kull ġimgħa u li għandu jkollhom test rapidu u li jista' jitqabbel mingħajr upload lil contractor.
Option 03

Otter / Trint

AI transcription b'editor orjentat għar-riċerka. Qawwi fl-Ingliż, immigħel għal monthly plans.

TurnaroundReal-time sa ~5 min
Accuracy fuq clean audio~90–93%
Speaker labelsIva · EN-tuned
LingwiOtter EN-only · Trint 30+
Spiża$17–80/user/mo (subscription)
PrivacyMaħżun fil-Account by default
Best forTeams li jriduh hosted library ta' kull intervista li ġie rekordjata qatt u li m'għandhom ħafna problema mal-monthly seat fee għal user.

Pricing u feature flags preċiżi mill-2026. Human Rev turnaround ivarja b'queue depth u length ta' audio.

Speċifiku għal intervisti

Tliet ħagħat li jumittu lin-nies fuq generic transcription tools.

Interview audio ħafna drabi m'huwiex clean. Iffranċa dawn is-settings u t-transcript iżomm fuq quoting.

X'imgħaddi

  1. 1Cross-talk fuq single channel. Meta s-sors tiegħek iżomm enfasi u jitkellimx fuq mistoqsija tiegħek, generic diarization iflok kemm f'block ta' speaker waħda.
  2. 2Source ismijiet u postijiet (Okafor, Tigray, Maranello) iridu lura phonetic. M'ghandhiex l-ebda utilità għall-fact-checking kontra transcript.
  3. 3Off-the-record moments jispiċċaw fit-transcript istess bħall-material quotable — l-ebda mod biex tmarki reġjun bħala redacted.

X'biex tibdel hawn

  1. 1Jekk il-field recorder tiegħek tikteb two-channel WAV (mic waħda għal track), azzjonx dak il-file direttament. Aħna ndetektaw per-channel u nskip diarization interament.
  2. 2Ippiazza l-prep notes tiegħek — ismijiet tas-sors, organizzazzjonijiet, ismijiet ta' postijiet — f'Custom vocabulary fuq il-job form. Recognizer jittrattahom bħala proper nouns magħrufa.
  3. 3Wara t-transcript jispiċċa, marki reġjun bħala off-record fl-editor. Isporta bħala `[REDACTED 14:22–15:08]` f'DOCX u TXT, b'l-audio tas-sors eliminat fi 24h regardless.

Recommended job settings għal intervisti

Azzjonx interview file u dawn jiffranċaw by default. Override per-job mill-form.

Diarization
Per-channel jekk stereo · acoustic else
Speaker model
Interview · 2–4 speakers
Lingwa
Auto-detect · code-switch on
Filler words
Imeħħud (verbatim mode)
Summary
Key quotes + topic index
Export
DOCX b'timestamps · plain TXT · JSON

Accuracy · real-world numbers

96% fuq good lav. Xorta leggibli fuq cafe recording.

L-accuracy tal-intervista hija limitata minn dak li l-mic attwalment samgħu. Close-mic stereo fuq kull speaker hija l-ċelling; telefown fuq tabella noisy hija l-floor. In-numri hawn taħtu nagħtu minn interview files ta' produzzjoni, mhux synthetic benchmarks.

96%
Dual lavalier · studio quiet

Mic waħda għal kull speaker, separate channels (Zoom H5/H6, Tascam DR-40). Diarization hija trivial — error huwa text-only.

94%
Handheld recorder fuq table

Condenser wieħed bejn żewġ speakers, quiet room. Acoustic diarization jifrid il-ħsejjes affidabilment taħt 4 ft.

90%
Phone voice memo · close

iPhone jew Pixel voice memo fuq it-tabella. Ismijiet u numri ħafna drabi jittilfu; cadence hu tajjeb għall-quotazzjoni.

84%
Field recording · cafe jew street

Espresso machines, traffic, third voices nearby. Wors case fil-data tagħna — usable għal navigation, ivverifikà quotes kontra audio.

Mistoqsijiet komuni

8 ħagħat li nies jistaqsew dwar transkrizjoni ta' intervisti.

01Jista' nkun nistgħu nuża dawn it-transcripts f'artikolu ppubblikat mingħajr verifika kontra l-audio?+
Għall-dirett quotes — no, dejjem ivverifikà kontra l-audio. AI transcripts f'94% accuracy xorta jaqraw kelmja waħda ħażin fi 17 fuq l-avvisu, u l-kelmja ħażina f'quote hija korrezzjoni. It-transcript huwa għan-navigazzjoni u drafting; l-audio hija s-sors tal-verità.
02Il-rekordjatur tiegħi ippikking stereo WAV b'mic waħda għal speaker. X'nistgħu nzommu?+
Azzjonx dak il-file direttament — m'għandekx tikkonverti għal mono l-ewwel. Aħna ndetektaw iż-żewġ channels u nirrutaw each lil track ta' diarization tiegħu l-ieħor, li hija l-highest-accuracy path li għandna. Mistennija 96%+ fuq quiet room.
03Xi ħaġa dwar intervisti rekordjati fuq phone call?+
Phone audio hija 8 kHz narrow-band, li tqarrqadx accuracy madwar 88% anki fuq clean line. Aħna xorta nifirdu ż-żewġ partiti bl-użu ta' channel separation jekk il-recorder app tiegħek kkappturahom separatament (ħafna jagħmlu). VoIP calls fuq WhatsApp jew Signal jiddumx ftit aħjar mill-PSTN.
04Jista' nkun nistgħu nneħħu off-the-record sections qabel naqsmu t-transcript?+
Iva. Fl-editor, agħżel it-timestamp range u markaha `[REDACTED]`. L-export jibdel it-test b'redaction marker imma yzommu l-timestamps sabiex id-dokument xorta jitrakkja l-audio.
05Inti tittrabbew mudelli fuq ir-rekordjazzjonijiet ta' intervista tiegħi?+
Le. L-audio tas-sors jiġi eliminat mill-infrastructure tagħna fi żmien 24 siegħa mill-kompletament, u aħna m'għandnax nistgħu nistgħu nittieħdu recording ta' customer għall-training mudelli taħt kwalunkwe plan. It-test tat-transcript jibqa' fil-account tiegħek sakemm tħassarha.
06Tliet jew erbgħa nies fuq panel interview — diarization xorta jaħdem?+
Sa madwar sitta voci distinti, iva, imma accuracy fuq speaker assignment jittigħ aktar ma żdied kull persuna miżjuda u jibdel agħar meta żewġ speakers simgħu simili. Ippreparax 2–3 minuta rename pass fuq is-speaker chips wara t-transcript jispiċċa.
07Tistax tittranskrivux intervisti f'lingwi għadda mill-Ingliż?+
99 lingwa, auto-detected. Code-switching (source tal-Ingliż qerqor bħala Spaniżi mid-sentence) jiġi trasattaw fi 12 language pairs. Accuracy ivarja by language — European languages jimqablu mal-Ingliż; low-resource African u Central Asian languages jiċċarru 5–10 punti baxxa.
08Jien nirekordjaw fuq Zoom call — jien għandu nisteqsi l-paġna Zoom tiegħek minflok?+
L-istess engine, l-istess riżultat. Il-paġna Zoom tkopri l-cloud-recording specifics (per-participant audio, dial-in degradation). Jekk inti mwegħdiet intervista waħda tul il-ħin fuq Zoom, kwalunkwe mogħdija taħdem — azzjonx l-MP4 hawn u s-speaker labels joħorġu l-istess.

Azzjonx ir-rekordjazzjoni tal-intervista tiegħek. Ara x'joħroġ.

30 minuta bla ħlas kull xahar. Ebda card. Speaker labels, 99 lingwi, l-exports kollha inklużi.

Ibda bla ħlas