Skip to content

Latest commit

 

History

History
371 lines (320 loc) · 22.3 KB

README.id.md

File metadata and controls

371 lines (320 loc) · 22.3 KB

README.md

🎶 Whisper Mate - Konversi Teks dari Rekaman/Audio Video Menggunakan Model Whisper-IA Secara Lokal. Jaga Kerahasiaan Anda!

Unduh versi terbaru di Mac App Store.

Screenshot

Fitur

Whisper Mate memungkinkan Anda untuk mengkonversi file-file audio atau video menjadi teks secara massal menggunakan model Whisper-IA dari OpenAI. Dengan editor subtitel yang terintegrasi, Anda dapat melihat hasil konversi per bagian. Seluruh proses konversi dilakukan secara lokal di perangkat Anda, menjaga kerahasiaan data Anda.

V5.5.1

  • Memperbaiki kesalahan dalam terjemahan otomatis ketika proyek selesai.
  • 148 MB

V5.5.0

  • Menambahkan opsi untuk model Deepgram nova-2
  • Menambahkan dukungan untuk transkripsi real-time dalam jendela mengambang dengan nilai transparansi yang dapat disesuaikan
  • Menambahkan opsi untuk hanya menampilkan konten yang diterjemahkan dalam transkripsi real-time
  • Menambahkan opsi gaya kustomisasi untuk jendela mengambang real-time (warna latar belakang, warna font)
  • Memperbaiki masalah di mana pengaturan otomatisasi tidak dipanggil saat menggunakan model transkripsi Deepgram
  • Memperbaiki masalah di mana jendela transkripsi real-time kadang-kadang tidak ditutup
  • 148 MB

V5.4.9

  • Tambahkan fitur template ekspor proyek secara massal, fitur ini dapat menghasilkan hasil proyek yang dipilih ke dalam satu file dari skrip template
  • Perbaikan bug dan peningkatan kinerja
  • 148 MB image

V5.4.8

  • Tambahkan pengaturan privasi di bilah status bawah jendela utama, dapat menonaktifkan analitik acara, laporan kerusakan, dan log lokal
  • Tambahkan contoh skrip untuk menghapus baris yang sesuai dengan kondisi tertentu
  • Tambahkan contoh skrip untuk mengganti string subtitle seperti '(Music) * Music * [Music]' menjadi string kosong
  • Tambahkan properti tulis kembali .memo .markWarn .warnMsg
  • Tambahkan opsi tampilan tunda pada pratinjau subtitle
  • Tambahkan alat untuk mengubah waktu mulai atau waktu akhir beberapa subtitle sekaligus di pengedit subtitle
  • Tambahkan pintasan (⇧)+←→ di pengedit subtitle untuk melompat 5 detik atau 30 detik dalam pratinjau
  • Tambahkan bilah kontrol pembicara dan dukungan pengaturan cepat dengan pintasan
  • Perbaiki masalah subtitle pratinjau yang tidak bisa disembunyikan
  • Perbaiki masalah editor template yang tidak dapat memotong teks ke clipboard & tidak dapat memilih dengan cara seret
  • Perbaiki format rentang waktu .t0f5 .t0f4 .t0f2 template kustom yang masih menghasilkan 3 digit angka dalam milidetik
  • 148 MB

V5.4.7

  • Tambahkan opsi auto start proyek ketika file ditambahkan ke daftar proyek (toggle berada pada statusbar di bagian bawah jendela utama)
  • Tambahkan langkah otomatisasi untuk mengekspor file secara otomatis ke folder kustom
  • Tambahkan langkah otomatisasi untuk mengirimkan hasil ke kotak surat Anda (Dapat secara otomatis menggunakan hasil ekspor otomatis sebelumnya sebagai lampiran)
  • Tingkatkan template dan editor javascript untuk memperbaiki masalah crash
  • 148 MB image

V5.4.6

  • Tambahkan opsi tata letak pratinjau media untuk teks terjemahan, transkrip sumber & terjemahan subtitle dapat mengontrol tampilan di atas atau di bawah.
  • Tambahkan model large v3 coreml.
  • Tambahkan pintasan ⌘+⌥+f atau ketuk dua kali pratinjau untuk beralih cepat ke layar penuh.
  • Beberapa pintasan sekarang mendukung tekan karakter tunggal untuk menjalankan (gabung, bagi, atur).
  • Setelah menggabungkan subtitle, sekarang baris penggabungan pertama akan otomatis dipilih.
  • Batalkan pengaitan aplikasi default terbuka dengan whisper mate untuk file audio dan video.
  • Perbaiki beberapa bug crash di V5.4.5.
  • Perbaiki masalah tampilan notifikasi.
  • Perbaiki beberapa masalah terjemahan.
  • 123 MB

image

V5.4.5

  • ❗Versi Universal mungkin perlu diunduh kembali. Karena saya mengupgrade perangkat pengembangan saya, dan lupa untuk menyimpan EDKey Universal deployment.
  • Tambahkan fitur otomatisasi untuk menjalankan pekerjaan saat transkripsi proyek selesai (gabungkan pengulangan/snapshot/skrip/terjemahan).
  • Tambahkan opsi transkripsi panjang segment maksimum.
  • Tambahkan contoh prompt model.
  • Tambahkan penggantian dengan karakter '\n' (garis miring tunggal dengan karakter n) ke baris baru dalam fitur penggantian.
  • Tingkatkan antarmuka konfigurasi opsi transkripsi proyek.
  • 122 MB

image

V5.4.4

  • Tambahkan daftar model cloud pada panel konfigurasi model dengan dukungan 2 host unduh. (Ubah ke host2 jika Anda tidak bisa mengunduhnya dari host1)
  • Dukungan cadangan menggunakan modul CoreML ketika opsi Mematikan Akselerasi GPU dinonaktifkan pada pengaturan umum
  • Memperbaiki masalah gagal mengunduh model besar
  • Memperbaiki masalah crash pada perangkat non Apple Silicon.
  • 122 MB

V5.4.3

  • Meningkatkan kecepatan transkripsi
  • Menambahkan dukungan untuk model besar v3 disinisik
  • Menambahkan dukungan mesin LibreTranslator
  • Menambahkan proyek duplikat dalam menu konteks proyek
  • Memperbarui kolom pembicara dapat diisi langsung dalam mode pengeditan (⌘+E)
  • Memperbaiki masalah jendela bertab ketika jumlah tab > 2
  • Memperbaiki masalah kadang-kadang crash tampilan gelombang suara
  • Memperbaiki masalah terjemahan di editor teks tambahan yang tidak dapat menerjemahkan baris yang dipilih

V5.4.2

  • Tambahkan opsi mengatur jumlah benang proses konfigurasi yang berbisik. (Menggunakan lebih sedikit benang agar komputer dapat melakukan pekerjaan lain, tetapi waktu proses akan meningkat)
  • Tambahkan dukungan mesin transkripsi Deepgram, juga dukungan dalam mode transkripsi aliran waktu nyata.
  • Tambahkan contoh template untuk mengekspor hanya konten pembicara khusus.
  • Tambahkan pencarian kata kunci yang diawali dengan @ untuk menyaring baris pembicara atau mengganti semua nama pembicara dengan nama lain (misalnya: @tom --> jack)
  • Tambahkan fitur untuk menyimpan konfigurasi pembicara proyek terbaru dan menggunakannya kembali di proyek baru.
  • Eksport template khusus ditambahkan dukungan untuk 9 template khusus sekarang.

V5.4.1

  • Menambahkan fitur manajemen jarak jauh Intranet web, menggunakan ponsel atau perangkat lain untuk menambahkan file yang akan diproses dan melihat status pemrosesan (di bagian bawah status bar jendela utama)
  • Menambahkan pemilih template konfigurasi parameter ai.
  • Menambahkan parameter ai untuk menekan tanda baca.
  • Tambahkan javascript untuk menggunakan permintaan http syncronous (Anda dapat menggunakannya untuk mengirim data baris subtitle ke layanan llm lokal Anda untuk mendapatkan hasil perbaikan, kemudian mengisi kembali ke subtitle asli, atau mengirimkannya ke layanan sistem http/https lainnya. Muat contoh http dari pemroses javascript untuk melihat cara menggunakannya)
  • Memperbaiki kesalahan denoise wav ketika path file mengandung karakter spasi.

image

V5.4

  • Tambahkan fitur pemotongan cepat
  • Tambahkan pintasan (c) untuk menampilkan atau menyembunyikan pratinjau pemutar editor subtitle
  • Tambahkan pintasan untuk mengubah kecepatan pratinjau pemutar editor subtitle
  • Ganti strategi bisu dengan strategi pecahan
  • Perbaiki bug pilihan redam

Fitur Pemotongan Cepat baru memiliki beberapa fungsi berikut:

  • Visualisasikan gelombang suara audio untuk mengidentifikasi dengan tepat dan memotong video.
  • Pisahkan file multimedia yang lebih panjang menjadi beberapa segmen untuk diproses secara terpisah sebelum ditranskripsi.
  • Gunakan strategi pecahan untuk melewati segmen yang bisu atau tidak dapat ditranskripsikan.
  • Potong secara terpisah segmen yang memerlukan transkripsi menjadi file-file individu.

image

V5.3.1

  • Tambahkan atribut prioritas proyek dalam antrean proses batch, prioritas yang lebih tinggi akan diproses terlebih dahulu (Opsi ada di menu konteks)
  • Fitur penggantian teks subtitle juga menggantikan kata kunci yang cocok dalam teks terjemahan
  • Mengatasi masalah Re-transcribe dengan strategi melewatkan suara diam & mengurangi masalah kebisingan

V5.3

  • Tambahkan lebih banyak model yang disesuaikan (kecil/medium) untuk bahasa-bahasa
  • Tambahkan strategi transcibe untuk melewati segmen yang senyap (terklasifikasi berdasarkan dB dan durasi senyap)
  • Tambahkan opsi untuk mengurangi kebisingan latar belakang
  • Tambahkan opsi untuk membuat transcribe menyembunyikan subtitle sebelum timestamp (tanpa bocoran)
  • Tambahkan contoh pemroses JavaScript untuk mengkapitalkan subjudul segmen

V5.2

  • Tambahkan model yang fein diatur untuk penyimpangan bahasa yang berbeda. kantonis/zh/ko/jp/de/fr/th/uk...
  • Tambahkan fitur untuk menambahkan Model AI Whisper yang diatur secara lokal ke Whisper Mate.
  • Tambahkan fitur untuk mengatur parameter model proyek secara batch.
  • Tambahkan opsi untuk mencegah dimulainya layar pengaman ketika ada antrian yang sedang berjalan.
  • Perbaikan ketika layar pengaman sistem dimulai, tugas pemrosesan dijeda.
  • Perbaikan saat mengklik baris editor teks terkadang tidak dapat berpindah ke posisi pemutar.
  • Perbaikan pembatalan dan pengembalian teks yang telah dimodifikasi pada editor teks tidak dapat dipanggil dari menu konteks.
  • Perbaikan ekspor secara batch ketika waktu gabungan tidak sesuai.

V5.1

  • Menambahkan fitur untuk mengekspor segmen/srt/template proyek secara massal dengan opsi untuk menggabungkan ke dalam satu file
  • Menambahkan fitur untuk merekam ulang baris tertentu dengan parameter ai yang berbeda
  • Menambahkan fitur untuk membatalkan atau mengulangi perubahan teks pada konten teks subtitle dengan perubahan ketikan manual (Shortcuts ⌘+Z undo / ⌘+⇧+Z redo)
  • Menambahkan fitur untuk menambahkan baris subtitle kosong baru di bawah baris yang dipilih (Shortcuts ⌘+N)
  • Menambahkan fitur untuk mengirim pemberitahuan selesai proyek melalui Slack incoming webhook. (Anda dapat mendapatkan pemberitahuan di telepon saat setiap proyek selesai)
  • Memperbaiki lokasi kotak kontrol pemutaran media yang tidak sejajar dengan tengah saat dalam tata letak jenis Up-Down.

V5.0

  • Menambahkan fitur untuk menggabungkan subjudul secara otomatis ke dalam paragraf berurutan
  • Menambahkan pemroses skrip kustom untuk menyesuaikan subjudul yang ditranskripsi secara massal
  • Menambahkan fitur penyunting subjudul. Fitur ini mirip dengan fitur pemisahan dan penggabungan subjudul, tetapi Anda dapat memilih beberapa baris dan menyesuaikannya dalam satu baris teks yang sama
  • Menambahkan penyunting subjudul dengan lebih banyak dukungan pintasan
  • Menambahkan font kustom ke panel konfigurasi gaya subjudul pratinjau video
  • Menambahkan font kustom ke panel konfigurasi memasukkan subjudul terbakar ke video asli
  • Menambahkan dukungan ekspor ke PDF atau DOCX, cukup tentukan akhiran ekspor menjadi pdf atau docx
  • Menambahkan lebih banyak format contoh ekspor terdefinisi. Anda dapat memuat dari contoh lalu menyesuaikan hasil template dengan mudah
  • Menambahkan fitur untuk membuat snapshot dari status subtitle proyek saat ini. Kemudian dapat dengan mudah dikembalikan ke snapshot yang disimpan
  • Menambahkan fitur impor .srt ke proyek saat ini sebagai snapshot
  • Menambahkan opsi untuk menampilkan teks terjemahan subjudul pratinjau video di atas teks asli
  • Menambahkan fungsi ekspor kustom. angka acak & guid acak & escXML & gantiString dengan format kustom
  • Menambahkan tipe output ekspor kustom (file atau clipboard)
  • Menambahkan opsi ekspor kustom untuk menggunakan semua subjudul yang diekspor atau hanya yang terpilih
  • Menambahkan grup jendela editor proyek dengan opsi jendela utama
  • Menambahkan konfigurasi parameter proses model bisikan tambahan dalam pemilih model (di pojok kanan bawah), mungkin tidak mudah ditemukan. Karena sebagian besar kasus tidak perlu mengubah parameter ini
  • Mengoptimalkan prilaku pratinjau video layar penuh
  • Dukungan kata kunci pencarian atau kondisi (gunakan | sebagai kata kunci atau. misalnya "hi|hello|hey")
  • Mengoptimalkan logika pencarian & penggantian. Ketika menggantikan eksekusi melakukan pencarian kata kunci akan disesuaikan untuk menunjukkan kata kunci sumber & kata kunci yang diganti
  • Mengoptimalkan logika transkripsi aliran waktu nyata
  • Memperbaiki beberapa jendela anak yang tidak muncul masalah
  • Memperbaiki bug format ekspor xml
  • Memperbaiki beberapa kegagalan ekstraksi media wav
  • Memperbaiki masalah tindakan penggantian yang aktif secara otomatis ketika meninggalkan kolom kata kunci penggantian
  • Memperbaiki beberapa masalah terkait proyek aliran waktu

V4.0

  • Menambahkan fitur untuk mengingat properti tata letak penyunting subjudul proyek. Setiap proyek dapat menggunakan tata letak dan ukuran pemutar pratinjau yang berbeda. (proyek lama perlu dibuka kembali agar dapat mengingat properti tata letak)
  • Menambahkan opsi untuk mencari subjudul yang diduplikasi dalam penyunting
  • Menambahkan opsi menu konteks untuk membuka penyunting bahkan jika proses skrip transkripsi belum dimulai
  • Menambahkan ekspor subjudul ke format .sbv
  • Menambahkan fitur templat ekspor kustom (seperti .fcpxml, .itt, .ttml)
  • Menambahkan plugin baru
  • Menambahkan opsi konfigurasi kata kunci dan penggantian yang sering digunakan untuk penggunaan cepat mencari atau mengganti
  • Menambahkan flag tanda di baris yang ditandai dalam tampilan kemajuan pemutar pratinjau
  • Menambahkan opsi tandai dalam menu konteks penyunting subjudul
  • Menambahkan fitur pemecahan baris dalam penyunting subjudul saat hanya memilih satu baris
  • Menambahkan tampilkan nama proyek dalam hasil pencarian
  • Menambahkan tampilkan info kesalahan ketika proses media pra-progres mengalami kesalahan
  • Menambahkan opsi untuk menyembunyikan tombol baris lokasi penyunting
  • Menambahkan pintasan ⌘+S untuk ekspor cepat .srt ke file
  • Memperbaiki masalah informasi meta audio saluran media mendapatkan dua saluran audio tetapi sebenarnya hanya satu. (menambahkan opsi untuk mengabaikan pemilihan saluran audio)
  • Memperbaiki kegagalan membakar subjudul saat nama proyek telah diubah secara manual
  • Memperbaiki beberapa masalah tampilan UI pada macOS 12
  • Memperbaiki masalah fitur tetap tidak mengunci opsi tampilan ikon bar status
  • Memperbaiki beberapa masalah tampilan tema terang

V3.5

  • Menambahkan fitur unduhan klip audio subjudul. Sekarang Anda dapat memilih subjudul apa pun kemudian menggunakan menu konteks untuk mengunduh klip audio, ketika memilih beberapa baris, akan secara otomatis digabungkan menjadi satu klip audio
  • Menambahkan gaya jendela mengambang kecil untuk pemotretan audio secara real-time
  • Menambahkan opsi menu konteks Menubar untuk memulai rekaman aliran ke proyek dengan jendela mengambang baru
  • Menambahkan pemutaran cepat segmen rentang baris audio dalam hasil pencarian global atau unduh langsung klip audio hasil pencarian
  • Menambahkan dukungan resume titik patah unduhan Model
  • Menambahkan fitur memo subjudul, sekarang Anda dapat menambahkan memo ke setiap subjudul dalam penyunting
  • Menambahkan opsi terjemahan azure
  • Menambahkan pencarian global subjudul dalam semua proyek
  • Menambahkan penyorotan kata kunci pencarian dalam hasil pencarian
  • Menambahkan pintasan default untuk kontrol jendela cepat seperti Tutup/Perbesar/Minimalkan
  • Menambahkan opsi untuk menyembunyikan label toolbar utama
  • Mengubah tombol mulai batch dari toolbar utama ke menu konteks
  • Memperbaiki tidak dapat menggantikan dengan string kosong
  • Memperbaiki masalah hilangnya model kecil dan kecil-en dalam server cadangan
  • Memperbaiki masalah penempatan slider pemutar file audio yang direkam

V3.0

  • Menambahkan ekspor rentang media subjudul terpilih ke file klip media baru
  • Menambahkan ekspor video dengan memasukkan subjudul terbakar ke video asli & gaya subjudul kustom
  • Menambahkan pratinjau langsung subjudul di dalam pratinjau video (gaya subjudul dapat disesuaikan di panel preferensi)
  • Menambahkan merekam audio mikrofon dan dukungan transkripsi real-time (macOS 13+)
  • Menambahkan fitur penggabungan subjudul. Rentang segmen & subjudul akan digabungkan menjadi satu baris
  • Menambahkan aplikasi merekam audio akan otomatis menyimpan ke file dan dapat diubah menjadi proyek transkripsi baru
  • Menambahkan opsi duplikat baris subjudul dan memungkinkan mengubah kontennya atau rentang waktu untuk menyesuaikan subjudul secara lengkap
  • Menambahkan opsi Aktifkan terjemahan bisikan ke dalam bahasa Inggris di panel konfigurasi model proyek
  • Menambahkan opsi menggunakan konfigurasi token desis untuk bisikan di panel konfigurasi model proyek
  • Menambahkan opsi untuk menonaktifkan pengguliran otomatis baris subjudul saat pratinjau video
  • Menambahkan dukungan kecepatan putar ulang pratinjau media
  • Menambahkan dukungan ⌘+V untuk menempelkan file yang disalin ke antrian proses
  • Menambahkan beralih cepat ke mode pengeditan. Semua subjudul dapat diedit atau dilihat dengan pintasan (⌘+E)
  • Menambahkan tampilan persentase penggunaan CPU saat pemrosesan bisikan
  • Menambahkan dukungan proyek arsip melalui menu konteks (membuat daftar proyek yang sedang dikerjakan tetap bersih)
  • Menambahkan terjemahan google dalam kontrol terjemahan subjudul
  • Menambahkan dukungan untuk lebih banyak bahasa aplikasi
  • Menambahkan tampilan media pratinjau ukuran penuh dengan tata letak subjudul
  • Menambahkan dukungan membuka file media di dalam fitur open with Finder
  • Mengoptimalkan kecepatan render data baris penyunting subjudul pada data besar
  • Memperbaiki masalah pemilihan video dengan banyak saluran audio
  • Memperbaiki masalah pemilihan video dengan banyak saluran audio
  • Memperbaiki masalah loncatan subjudul pratinjau & penyunting dan masalah navigasi penggeser video

V2.0

  • Mendukung merekam dan mentranskripsikan audio di aplikasi lain seperti (Zoom/Skype/Teams/Meetings App, macOS 13.0+)
  • Menambahkan plugin untuk mengonversi subjudul berbahasa Tionghoa sederhana menjadi tradisional atau sebaliknya. (Perlu mengaktifkan plugin pertama kali di panel preferensi)
  • Memperbaiki penyunting proyek tidak dapat menggunakan pintasan spasi untuk memutar atau menghentikan masalah media
  • Memperbaiki bug format ekspor SRT dan VTT

V1.0

  • Mentranskripsi file audio atau video
  • Menggunakan API deepl gratis untuk menerjemahkan subjudul
  • Menanamkan penyunting subjudul untuk memperbaiki transkripsi
  • Ekspor ke SRT, VTT, CSV, JSON, SEGMENT
  • Mendukung mengatur pembicara untuk setiap subjudul
  • Mayoritas operasi mendukung seleksi massal untuk dijalankan. Seperti menjalankan tugas massal. menerjemahkan baris-baris massal. mengatur pembicara baris-baris massal
  • Mendukung seret dan lepas file untuk memulai transkripsi
  • Mendukung mengetik pada pencarian transkrip
  • Penyunting dapat memutar audio atau video dengan sinkronisasi rentang pemutaran
  • Mendukung konversi multi-bahasa
  • Mendukung bahasa yang sering digunakan kustom untuk mengonversi atau menerjemahkan

Fitur

  • Mengonversi file audio atau video menjadi teks
  • Mendukung perekaman dan konversi audio dalam aplikasi lain seperti (Zoom/Skype/Teams/aplikasi lainnya, hanya untuk macOS 13.0+ dan membutuhkan izin rekaman layar)
  • Menggunakan API DeepL gratis untuk menerjemahkan teks terjemahan
  • Alat pengeditan subtitle terintegrasi
  • Ekspor dalam format SRT, VTT, CSV, JSON, SEGMENT
  • Kemampuan untuk menentukan nama orang untuk setiap subtitle
  • Sebagian besar fitur mendukung operasi kelompok. Misalnya, menjalankan tugas dalam kelompok, menerjemahkan baris secara massal, dan menugaskan secara massal ke seseorang
  • Mendukung drag and drop file untuk konversi subtitle
  • Kemampuan menulis teks saat melihat subtitle
  • Tersedia pratinjau pemutaran file audio atau video dalam alat pengeditan
  • Kemampuan untuk mengekspor seleksi subtitle sebagai file media baru
  • Subtitle dapat diekspor ke dalam video asli dengan gaya subtitle tetap atau kustom
  • Tampilan langsung subtitle dalam pratinjau video (pengaturan subtitle dapat disesuaikan dalam pengaturan)
  • Perekaman audio dengan konversi teks secara real-time (macOS 13+)
  • Tersedia penggabungan segmen subtitle. Area segmen dan teks subtitle digabungkan menjadi satu baris
  • Rekaman aplikasi secara otomatis disimpan dan dapat dikonversi menjadi proyek konversi baru
  • Kemampuan untuk menyalin baris subtitle atau mengubah latar belakang sinkronisasi waktu
  • Pengaturan pemutaran kustom untuk pratinjau media
  • Kemampuan untuk menempelkan file yang disalin ke antrian menggunakan pintasan ⌘+V
  • Tampilkan penggunaan CPU saat memproses suara
  • Mendukung pembuatan arsip dalam menu konteks (untuk menjaga daftar proyek aktif tetap teratur)
  • Mendukung terjemahan teks dengan Google Translate
  • Tampilkan subtitle dalam tampilan layar penuh saat pratinjau media
  • Kemampuan untuk membuka presentasi multimedia melalui menu konteks Finder
  • Mendukung konversi multibahasa
  • Mendukung konversi atau terjemahan untuk bahasa yang paling umum digunakan

Tangkapan Layar

screenshot

screenshot1

screenshot2

screenshot3

screenshot4

screenshot5

screenshot6

screenshot7

screenshot8

screenshot10

screenshot11

screenshot12

screenshot13

screenshot14

screenshot15

screenshot16