Ses dosyalarını metne dönüştüren ve özellikle “çevrimdışı” (internete yüklemeden) çalışan uygulamalar var mı?
Tabi Türkçe dil paketi olan
Speech note (dsnote) uygulaması var ancak Pardus’a yüklenemiyor hata veriyor. (python3.12, libfmt9`istiyor)
Tavsiyeler için şimdiden teşekkür ederim
Merhabalar @av-yeni .
Aradığınız uygulamayı bulabildiniz mi?
Çünkü şuan banada lazım.
Lütfen yanıtımı cevaplayın.
Saygılarımla,
Berat Kaylesiz.
Geçenlerde ihtiyaç üzerine biraz araştırdım ve benim için en uygun çözümün burada olduğuna karar verdim:
Bir yerlere gidip bazı hazır dosyaları da indirdim (İngilizce ya da çok dilli seçenekleri var sadece).
Şimdiye dek sadece İngilizce ses/video dosyası ile denedim, çok başarılı gördüm.
Türkçe desteği nasıl bilemiyorum - onu da bir ara deneyeceğim.
Donanım Durumu: İşlemci modern AVX/AVX2 komut setlerini desteklemiyor (SSE3 seviyesinde).
Sorun: Standart Whisper araçları (Vibe vb.) “Yönerge kural dışı” (Illegal Instruction) hatası veriyordu.
Çözüm: whisper.cpp kaynak kodundan, işlemcinin reddettiği AVX özellikleri kapatılarak (disable) özel olarak derlendi
Sonuç : whisper.cpp çalışıyor.
Vibe, speech note vs kullandığım donanımın eski olması nedeniyle hata vermiş olabilir
Benim işlemci biraz zayıf kaldığından orta boy modellerde bile biraz zorlanıyor. Belki bu yüzden Türkçe çok iyi sonuç alamadım.
Fakat İngilizce de çok işime yaradığından, YZ desteğiyle basit bir Python betikle dosya yöneticisinden bir ses veya video dosyasını sağ tıkladığımda mevcut (indirilmiş) modeller listesinden birini seçerek düz metin (TXT) veya altyazı (SRT) dosyası üretilmesini sağladım.
Eminim bu konuda yetkin olan biri bundan çok daha iyisini yapabilir - örneğin, hazır modelleri indirme seçeneği dahil ederek).
whisper.cpp çalışmakla birlikte sesi çok “hatalı” olarak metne çeviriyor.
Elle not alma, bu kadar çok hatayı düzeltmeye çalışmaktan daha kolay ![]()
@av-yeni Erdem Bey, Android işletim sisteminde FDroid açık kaynaklı uygulama mağazasından indirilen Librera FD diye bir uygulama var.
Nasıl kullandığımı bir paylaşımımda açıklamıştım, bağlantısını bulursam bu yazımın altına yapıştırayım:
Yine aynı FDroid uygulama mağazasından TTS Util isimli uygulama ile sesli okuma motoruna ince ayar tercihlerinizi yapabilirsiniz.
Cep telefonunuzda değil de Pardus’ta bu uygulamaları kullanmak isterseniz waydroid kurmanız gerekiyor.
Teşekkür ederim İsmail Emre Bey.
Sanırım sizin paylaştığınız metinden sese dönüşüm , benim aradığım sesten metne dönüşüm.
yutup videolaında oluyo konuşmayı metine çeviriyor ama oda düzgün değil tam
Ben bu programı kurdum. Hem ses hem de video dosyalarından metne dönüştürüyor.
Teşekkürler. Bu güzel bir grafiksel arayüz olmuş. Aynı biçimde OpenAI Whisper modelleri kullanılıyor fakat indirilip kullanılan “ggml-large-v3-turbo.bin” modeli (1.6 GB) Türkçe metin oluşturmada oldukça başarılı oluyor.
@av-yeni Erdem Bey, sorunuz çözüm bulduysa sorunuzu çözen iletiyi çözüm olarak işaretlemelisiniz.
Maalesef benim donamımıma uygun bir çözüm yok.
Tüm cevaplar yararlı şüphesiz.
Hepsi işaretlenebilir mi ![]()
Bir dahakinde dsnote kurarken yine aynı paket bağımlılıkları çıkarsa bunları, Synaptic Paket Yöneticisi’nden isimlerini aratıp kurmayı deneyiniz.
