Interjúátírás.Különböző felvétel, ugyanaz az eredmény.

Telefonos hangjegyzet, Zoom-hívás, laveliér vagy kézi hangrögzítő — dobja fel az interjúfelvételt és kapjon beszélőjelöléssel ellátott, időbélyegzett szöveget, amelyet idézhet.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Nézze meg, mi jön ki

Két hang bemegy. Két hang jön ki, jelölve.

A legtöbb interjú két ember egy eszközön — egy telefon az asztalon, egy rögzítő kettőjük között. Az interjúhangunkat egy monó csatornáról is szétválasztjuk a riporter és forrás között, majd minden fordulóhoz időbélyegeket adunk az idézéshez.

Hangrögzítő · WAVREC 2 beszélő · 38:42
automatikusan felismert en-US48 kHz mono · 1411 kbps
~90s
Átirat · streaming94% pontosság
S1

Tudnál beszélni arról, mit láttál a tizennyolcadik reggel?

S2

Körülbelül hat körül érkeztem. Az átrakodási ajtó már nyitva volt, ami nem szabad, hogy legyen.

S1

Az ajtó problémáját már előtte jelentetted — kinek?

S2

Diane Okafor karbantartásnak, kétszer márciusban. Vannak e-mailjaim.

94% hangrögzítő WAV-onDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Három valós lehetőség · őszinte összehasonlítás

Rev emberi átírás. Otter vagy Trint. Vagy mi.

A Rev az audiódat emberi átírókhoz küldi — lassú és drága, de kiváló minőség rossz hangon. Az Otter és Trint hozzánk hasonlóan AI-alapú, újságírók és kutatók számára optimalizáltak. Íme, hol illik az egyes.

Option 01

Rev emberi átírás

Igazi emberek írják le az interjúdat. Legjobb rossz hangon, de 12–24 órát vársz és több fizetsz.

Fordulási idő12–24 óra tipikusan
Pontosság tiszta hangokon99% (állítólag)
BeszélőjelölésekKézi, benne van
NyelvekEN emberi · 30+ AI
Költség · percenként$1.50 emberi · $0.25 AI
AdatvédelemAudio alvállalkozóknak küldve
Best forBírósági vagy publikációkritikus interjúk, ahol emberi fülelre van szükséged rossz hangokon, és van egy napod a várakozásra.
Option 02

Transcription.Solutions

AI-átirat, beszélő szerinti szétválasztás, percek alatt kész. Ugyanaz a motor telefon-, Zoom- és hangrögzítő-felvételekhez.

Fordulási idő~3 perc óránként
Pontosság tiszta hangokon94–96%
BeszélőjelölésekAutomatikus · átnevezés az editorban
Nyelvek99, automatikus felismerés
Költség · percenként$0.03
AdatvédelemAudio 24 óra után törlődik · nem tanítunk
Best forÚjságírók, kutatók és producerek, akik hetente több interjút készítenek, és gyors, idézhető szöveget akarnak alvállalkozók közreműködése nélkül.
Option 03

Otter / Trint

AI-átírás kutatási editorral. Angolul erős, havi csomagokhoz kötött.

Fordulási időValós idejű ~5 percig
Pontosság tiszta hangokon~90–93%
BeszélőjelölésekIgen · EN-optimalizált
NyelvekOtter csak EN · Trint 30+
Költség$17–80/felhasználó/hó (előfizetés)
AdatvédelemAlapértelmezés szerint fiók alatt tárolva
Best forCsapatok, akik egy központi könyvtárat szeretnének minden valaha rögzített interjúról, és nem zavarnak a felhasználónkénti havi díjak.

Az árak és funkciók 2026-ban helyesek. A Rev emberi fordulási ideje a sor és az audio hossza szerint változik.

Interjúkra jellemző

Három dolog, amely problémát okoz az általános átírási eszközöknél.

Az interjúhang ritkán tiszta. Ezek a beállítások megadják az átíratnak az erőt az idézéshez.

Mi megy rosszul

  1. 1Átfedő beszéd egy csatornán. Ha a forrásod hangsúlyosan beszél és beleszól a kérdésedbe, az általános szétválasztás mindkettőt egy beszélőblokkba összevonja.
  2. 2Forrásnév és helyek (Okafor, Tigray, Maranello) fonetikusan jönnek vissza. Nem használható az átirat alapján történő tényellenőrzéshez.
  3. 3Nem publikálható részek ugyanabban az átiratban vannak, mint az idézhető anyag — nincs mód egy terület redaktálásként jelölésére.

Mit állítsd be itt

  1. 1Ha a rögzítőd kétcsatornás WAV -ot ment (egy mikrofon szálanként), töltsd fel közvetlenül ezt a fájlt. Csatornánként felismerünk, és kihagyjuk a szétválasztást.
  2. 2Illeszd be az előkészítési jegyzeteidet — forrásnév, szervezet, helynév — az Egyéni szókincs mezőbe. Az felismerő már ismert tulajdonnevekként kezeli őket.
  3. 3Miután az átirat megérkezik, jelöld meg az időtartományt nem-publikálhatóként az editorban. A DOCX és TXT exportban `[REDACTED 14:22–15:08]` -ként jelenik meg, az audio pedig 24 óra után törlődik.

Ajánlott munkabeállítások interjúkhoz

Interjúfájl feltöltésekor ezek alapértelmezésben be vannak kapcsolva. A munkaforma alapján felülírható.

Szétválasztás
Csatornánként, ha sztereo · akusztikus másként
Beszélőmodell
Interjú · 2–4 beszélő
Nyelv
Automatikus felismerés · kód-váltás be
Töltőszavak
Megtartva (szószerinti mód)
Összefoglalás
Fő idézetek + témamutató
Export
DOCX időbélyegekkel · sima TXT · JSON

Accuracy · real-world numbers

96% egy jó laveliérrel. Még mindig olvasható egy kávézóban rögzített felvételen.

Az interjúpontosság az határozza meg, amit a mikrofon ténylegesen hallott. A kettős laveliér sztereo csatornája minden beszélőnek a legmagasabb — az asztalon lévő telefon a legalacsonyább. Az alábbi számok termelési interjúfájlokból származnak, nem szintetikus méréspontokból.

96%
Kettős laveliér · stúdió-csendes

Egy mikrofon egy beszélőnek, külön csatornák (Zoom H5/H6, Tascam DR-40). A szétválasztás triviális — a hiba csak szöveg.

94%
Kézi rögzítő az asztal közepén

Egy kondenzátor két beszélő között, csendes szoba. Az akusztikus szétválasztás megbízhatóan szétválasztja a hangokat 1,2 méter alatt.

90%
Telefonos hangjegyzet · közeli

iPhone vagy Pixel hangjegyzet az asztal közepén. Nevek és számok időnként hiányoznak; az ütem jó az idézéshez.

84%
Hangrögzítő · kávézó vagy utca

Kávéfőzők, forgalom, harmadik párbeszédek. Az adatainkban a legrosszabb — navigációhoz használható, az idézeteket ellenőrizd az audio alapján.

Gyakori kérdések

8 kérdés az interjúátírásról

01Használhatok ezeket az átiratokat egy publikált cikkben anélkül, hogy az audioért szavatolnék?+
Közvetlen idézetekhez — nem, mindig szavatolj az audioért. Az AI-átiratok 94% pontossággal még mindig elhibáznak átlagosan egy szót a 17-ből, és egy idézetben a rossz szó helyesbítésre szükséges. Az átirat navigációs és vázlatfeladat; az audio az igazság.
02Az rögzítőm kétcsatornás WAV-ot mentett, egy mikrofon beszélőnként. Mit tegyek?+
Töltsd fel közvetlenül — ne konvertáld monóra előbb. Felismerjük a csatornákat, és mindegyiket saját szétválasztási sávhoz irányítjuk, ami a legpontosabb útvonal. Csendes szobában 96%+ várható.
03Mi a helyzet a telefonhívás felett rögzített interjúkkal?+
A telefonaudio 8 kHz sávszélességű, ami még tiszta vonalon ~88%-ra korlátozza a pontosságot. Továbbra is szétválasztjuk a feleket csatornaszeparáció segítségével, ha a rögzítőalkalmazás külön rögzítette őket (a legtöbb megtesz). A WhatsApp vagy Signal feletti VoIP kicsit jobb, mint a hagyományos telefon.
04Az interjú szövegét redaktálhatom az átirat megosztása előtt?+
Igen. Az editorban válaszd ki az időtartományt, majd jelöld `[REDACTED]` -ként. Az export lecseréli a szöveget redakciós jelölővel, de megtartja az időbélyegeket, hogy az audit követhető maradjon.
05Az interjúfelvételekből tanítotok modelleket?+
Nem. Az audio véglegesen törlődik 24 órán belül az infrastruktúránkból, és egyetlen csomag alatt sem használunk ügyfél-felvételeket tanításra. Az átirat szövege a fiókodban marad, amíg nem törlöd.
06Három vagy négy személy egy panelbeszélgetésben — működik még a szétválasztás?+
Körülbelül hat különálló hangig igen, de a beszélő-hozzárendelés pontossága csökken az egyes újabb beszélővel, és romlik, ha kettő hasonlóan hangzik. Számítsd a beszélőlabdák 2–3 perces átnevezésére az átirat után.
07Képes vagy angol mellett más nyelvű interjúkat átírni?+
99 nyelv, automatikus felismeréssel. A kódváltás (angol forrás spanyolra csúszik a mondat közepén) 12 nyelvpárban megoldott. A pontosság nyelvfüggő — az európai nyelvek egyenlítik az angolt; az alacsony-erőforrás afrikai és közép-ázsiai nyelvek 5–10 ponttal alacsonyabbak.
08Zoomon rögzítem — használnám inkább a Zoom oldalt?+
Ugyanaz a motor, ugyanaz az eredmény. A Zoom oldal a felhő-rögzítés sajátosságait fedi (beszélőnkénti hang, csatornaminőség-romlás). Ha egy interjút Zoomon végzel, mindkét út működik — töltsd fel az MP4-et itt, és ugyanez a beszélőjelölés jön ki.

Dobja fel az interjúfelvételét. Nézze meg, mi jön ki.

30 ingyenes perc havonta. Nincs szükség kártyára. Beszélőjelölések, 99 nyelv, az összes export benne van.

Ingyenes kezdés