Transkrypcja dla dziennikarzy.Wywiady źródłowe, etykiety osób mówiących, znaczniki czasu dla cytacji.

Wrzuć wywiad źródłowy — przez telefon, lavaliere, dyktafon terenowy, czy konferencję prasową. Uzyskaj transkrypt z etykietami osób mówiących i znacznikami czasu dla cytacji, potem DOCX, który Twój weryfikator może opatrzyć adnotacjami.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Zobacz, co wychodzi

Audio wywiadu wchodzi. Transkrypt do cytowania wychodzi.

Każda wypowiedź osób mówiących otrzymuje znacznik czasu, aby móc wrócić do nagrania, gdy Twój redaktor lub weryfikator skwestionuje cytat. Słowa wypełniające pozostają domyślnie — integralność cytatu się liczy.

Wywiad źródłowy · WAVREC 2 osoby mówiące · 38:12
automatycznym wykryto en-US44.1 kHz · lavaliere + pokój
~90s
Transkrypt · przesyłanie strumieniowe94% dokładności
S1

Powiedz mi, kiedy pierwszy raz zauważyłeś przekroczenie budżetu w projekcie mieszkaniowym.

S2

To było na komisji finansów 14 marca. Liczba skoczyła z 22 do 31 milionów bez żadnego pisma.

S1

A nikt z rady nie zapytał, gdzie poszło dodatkowe dziewięć milionów?

S2

Jedna osoba pytała. To jest na nagraniu. Potem ten punkt przeniósł się na zamkniętą sesję.

94% przy lavalierzeDOCX · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Trzy rzeczywiste opcje · uczciwe porównanie

Rev (człowiek). Trint. My.

Usługa human-typed Rev to domyślny standard redakcji — dokładna, droga, wolna. Trint zbudował edytor AI zsynchronizowany z redakcją. My robimy transkrypt AI, usuwamy plik w ciągu 24 godzin, i chowamy się z drogi.

Option 01

Rev (human-typed)

Osoba pisze Twoje nagranie. Najwyższa dokładność na trudnym audio — płacisz za to w dolarach i godzinach.

Czas realizacji12–24h typowo
Dokładność99%+ (human)
Koszt · za minutę$1.50 (human)
Prywatność źródłaKontraktor słucha
Usuwanie plikuZatrzymane na mocy polityki
EksportDOCX · TXT · SRT
Best forAkta o jakości sądowej lub reportaż dotyczący sądu, gdzie słuch człowieka na każde słowo wart jest premii za dolara na minutę.
Option 02

Transcription.Solutions

Transkrypt AI w minuty. Nagranie źródła usunięte w ciągu 24 godzin. Niestandardowy słownik dla nazw źródeł i miejsc.

Czas realizacji~1× realtime
Dokładność94% przy lavalierze
Koszt · za minutę$0.03
Prywatność źródłaŻaden człowiek nie słucha
Usuwanie plikuTrwałe usunięcie w ciągu 24h
EksportDOCX · SRT · TXT · JSON
Best forReporterzy pracujący na wyznaczonym terenie — wywiady codzienne, źródła pod embargiem, nagrania terenowe ze schodów sądu lub urzędu miasta.
Option 03

Trint

Edytor AI zsynchronizowany z redakcją z przepływami pracy kolaboracyjnej. Mocny produkt, cennik subskrypcji.

Czas realizacji~1× realtime
DokładnośćPorównywalna warstwa AI
Koszt$80+/user/miesiąc
Prywatność źródłaCloud — zatrzymane
Usuwanie plikuPrzechowywane aż do usunięcia
EksportDOCX · SRT · EDL
Best forZespoły redakcji, które chcą edytora, funkcji kolaboracyjnych i w pełni płatne stanowisko na reportera.

Ceny przybliżone na 2026 rok. Warstwa automatyczna Rev jest oddzielona od warstwy human-typed porównanej tutaj.

Specyficzne dla dziennikarstwa

Trzy rzeczy, które przysporią kłopotów reporterom przy ogólnodostępnych narzędziach transkrypcji.

Zanim wgram plik, przełącz odpowiednie ustawienia — transkrypt wróci bliżej publikowalności.

Co pójdzie źle

  1. 1Nazwy własne odgadywane fonetycznie. Nazwy źródeł, akronimy agencji (HUD, DOT, FOIA), akapity rachunkowe (SB-1421, HB-340) wracają jako rozsądnie brzmiące błędne słowa.
  2. 2Słowa wypełniające usuwane domyślnie. Ogólnodostępne narzędzia usuwają "um, well, I think" — czego nie ma problemu dla spotkań, ale rujnuje integralność cytatu, gdy redaktor porównuje tekst do audio.
  3. 3Przeplótka konferencji prasowej zapaść w jedno źródło. Sześciu reporterów staje się "Osób mówiących 2" i tracisz atrybucję na temat tego, kto o co pytał.

Co przełączyć tutaj

  1. 1Wklej nazwy źródeł, skróty agencji, i ID rachunków do Słownika niestandardowego na formularzu pracy. Przekazujemy je jako wskazówki do opozatora.
  2. 2Ustaw Słowa wypełniające: zachowaj aby "um" i "like" zostały. Usuń je w DOCX po dopasowaniu cytatu do audio.
  3. 3Dla praserek podnieś Max osób mówiących do 8–10 i włącz znaczniki czasu dla każdej wypowiedzi. Łatwiej wyczyścić etykiety ręcznie niż odzyskać utracone atrybucje.

Rekomendowane ustawienia pracy dla wywiadów źródłowych

Wrzuć wywiad a te przełączą się domyślnie. Zmień na pracę z formularza.

Diaryzacja
Włączone · 2–10 osób mówiących
Znaczniki czasu
Każda wypowiedź osób mówiących
Słowa wypełniające
Zatrzymane (integralność cytatu)
Słownik niestandardowy
Nazwy źródeł + miejsc
Język
Autodetekcja · 99 wspieranych
Eksport
DOCX ze znacznikami czasu · SRT

Accuracy · real-world numbers

94% przy lavalierze. Do poniżej 80% przy głośnym podium.

Reporterzy nagrają w warunkach, które transkryptyści nie zawsze planują. Mikrofon i pokój ustawiają limit — nie model. Poniższe numery pochodzą z rzeczywistych plików dziennikarskich w produkcji, a nie z syntetycznych testów.

96%+
Studio lub spokojna rozmowa 1-na-1, mikrofon USB

Konfiguracja na poziomie podcastu, jedno źródło za stołem na mikrofonzie kardioidalnym lub lavalierze. Nazwy własne to jedyna przewidywalna wada.

94%
Rozmowa telefoniczna lub Zoom ze źródłem

Współpracujące źródło na szerokopasmowym połączeniu. Pewna strata dotycząca liczb, ID rachunków i nieznanych nazwisk. Niestandardowy słownik przywraca większość z tego.

89%
Dyktafon terenowy, kawiarnia lub chodnik

Tascam lub telefon w kieszeni kurtki. HVAC, ruch, naczynia. Słowa użyteczne do wyciągania cytatów — oczekuj verificación przebiegu na audio.

84%
Konferencja prasowa, mikrofon pokojowy, przeplótka

Sześciu reporterów wrzeszczy pytania, podium PA echo, brak indywidualnych mikrofonów. Diaryzacja połączy niektórych pytających. Najgorszy przypadek w naszych danych.

Często zadawane pytania

8 rzeczy, które reporterzy pytają o transkrypcję dla dziennikarzy.

01Jak długo przechowujesz nagranie ze źródła?+
Pliki źródłowe są trwale usuwane w ciągu 24 godzin od zakończenia pracy. Transkrypt pozostaje na Twoim koncie; nagranie nie. Jeśli spotykasz się z wrażliwym źródłem, to odpowiedź do przekazania im.
02Czy człowiek słucha mojego wywiadu?+
Nie. Rurociąg to AI od końca do końca — żadna ocena kontraktorów, żaden krok QA człowieka na Twoim pliku. Jeśli potrzebujesz transkryptu human-typed (jakości sądowej), usługa human tier Rev jest właściwym narzędziem, nie my.
03Czy mogę transkrybować nagranie rozmowy telefonicznej z TapeACall lub iPhone Voice Memos?+
Tak. Wrzuć M4A lub MP3 bezpośrednio. Oczekuj ~93–94% na szerokopasmowym VoIP. Jeśli źródło dzwoniło z linii stałej lub słabego zasięgu komórkowego, spadnij do ~88% — nadal użyteczne do wyciągania cytatów, po prostu weryfikuj na audio.
04Jak oznaczam sekcję jako off-the-record?+
Nie mamy przełącznika off-the-record w samym pliku. Przepływ pracy, którego większość reporterów używa: przytnij minuty off-the-record z audio przed wgraniem, lub wgraj pełny plik i usuń te akapity z DOCX. Usuwanie audio w ciągu 24 godzin ogranicza ekspozycję w każdym razie.
05Czy znaczniki czasu będą wystarczająco dobrze wyrównane do faktu-czeku na tle nagrania?+
Tak. Wydajemy znacznik czasu przy każdej wypowiedzi osób mówiących i, w SRT, co 2–7 sekund. Weryfikator może kliknąć w audio na dowolnym cytacie w mniej niż 10 sekund. Eksport DOCX domyślnie zachowuje znaczniki czasu w linii.
06Moje źródło mówi po hiszpańsku. Czy możesz transkrybować w języku hiszpańskim i tłumaczyć?+
Transkrybujemy w języku źródła na 99 języków, autodetekcja. Tłumaczenie na angielski to oddzielny opcjonalny krok w formularzu pracy — produkuje drugi plik, aby zachować oryginalny transkrypt hiszpański dla dokładności.
07Jak dobrze diaryzacja obsługuje konferencję prasową z sześcioma reporterami?+
Akustyczna diaryzacja na mikrofonach pokojowych połączy głosy podobnie brzmiące — oczekuj 2–3 reporterów do połączenia w jedną etykietę osób mówiących. Podnieś max osób mówiących do 8–10 na formularzu, potem zmień nazwę etykiet osób mówiących ręcznie. Szybciej niż przepisywanie.
08Czy transkrypt jest akceptowalny jako zapis prawny?+
Żaden transkrypt AI nie jest zbiorem certyfikowanym. Do reportażu związanego z sądem nagranie jest dokumentem i transkrypt to Twój dokument roboczy. Jeśli potrzebujesz certyfikowanego transkryptu do wezwania lub obrony zniesławienia, użyj sądowej — nie my, nie Trint, nie warstwa AI Rev.

Wrzuć wywiad źródłowy. Zobacz, jak wraca do cytowania.

30 darmowych minut co miesiąc. Bez karty. Etykiety osób mówiących, znaczniki czasu dla cytacji, usuwanie audio w ciągu 24 godzin na każdym planie.

Zacznij bezpłatnie