Bir Belgenin Karakter Kodlamasını Değiştirme

Selâmünaleyküm

Bir altyazı dosyası indirdiniz diyelim, bu dosyayı filme attığınızda bazı Türkçe karakterlerin sorunlu olduğunu gördünüz veya herhangi bir sebepten dolayı bir belgenin karakter kodlamasını (charset) değiştirmeniz gerekti. Peki bunu nasıl yapacağız?

2 Beğeni

Ve Aleykümselam

Bunun için belgemizi açalım ve yukarıdaki dosya kısmından farklı kaydet diyelim.

Ardından önümüze gelen ‘nereye kaydedelim?’ penceresinin sol-alt tarafındaki (belki yeri farklı olabilir.) “Kodlama” yazan yerden seçim yapacağız.

Buradan seçiminizi yapabilirsiniz. Türkçe karakterlerde altyazı sorunu yaşıyorsanız ISO-8859-9 karakter kodlamasını seçebilirsiniz. (Sanırım bunun için bu karakter kodlamasını sistemden aktif etmeniz gerekiyor. Yazımızın devamında bulabilirsiniz.)

Eğer aradığınız burada yoksa “Tüm kodlamaları göster” kutucuğuna basabilirsiniz.

daha sonrasında dosyanızı kaydediyorsunuz. İşte bu kadar basit.


Komut Satırı Üzerinden

Komut satırı üzerinden ise iconv komutunu kullanarak yapabiliriz:

iconv -f <dosyanın orijinal karakter kodlaması> -t <olmasını istediğimiz yeni karakter kodlaması> <değiştirmek istediğimiz dosya> -o <değişmiş hâlinin ismi>

meselâ UTF-8 kodlu bir metni ISO 8859-9 karakter kodlamasına bürünmesini istiyoruz o zaman:

iconv -f utf-8 -t iso-8859-9 altyazi.srt -o degistirilmisaltyazi.srt

not: Burada değiştirmek istediğimiz dosya korunur, onun yerine yeni bir dosya oluşur ve değişiklikler ona kaydedilir. Eğer aynı dosyayı değiştirmek istiyorsanız -o parametresinden sonra yine aynı dosya ismini yazabilirsiniz.


Bu konuda tam emin değilim ama sistemde aktif olmayan bir karakter kodlamasını kullanamayabilirsiniz. ISO 8859-9 varsayılan olarak aktif değil sanırım (belki altyazılar için lazım olabilir), isterseniz aktif edelim.

Aktif Olmayan Karakter Kodlamalarını Aktif Etme

Uçbirimden:

sudo mousepad /etc/locale.gen

Eğer Gnome kullanıyor veya başka bir metin editörü kullanıyorsanız mousepad kısmını değiştirmeniz gerekebilir. Çünkü Mousepad XFCE’de kurulu gelen bir metin editörüdür. Meselâ Gnome’dekinin ismi ise gedit.

Şimdi aşağıdan tr_TR ISO-8859-9 ifadesini bulup yanındaki # işaretini ve yanındaki boşluğu silelim yani yazıyı kenara dayayalım.

Ekbilgi: Steam üzerinden oyun oynayanlar bazı oyunları açarken karakter kodlaması hatasıyla karşılaşabilirler, onlar en_US.UTF-8’i de aktif edebilirler.

Ardından kaydedip çıkalım ve uçbirim üzerinden şu komutu girip kodlama verisini güncelleyelim:

sudo locale-gen

Pasif hâle getirmek isterseniz eğer, eski hâline (başında # işareti olan hâli) getirmeniz yeterli olacaktır.

Selâmetle

3 Beğeni

Bir dosyanın karakter kodlamasını öğrenmek istiyorsanız uçbirim yardımıyla şu komutu kullanarak bunu yapabilirsiniz:

file -bi dosyaismi

Sonuç olarak şöyle bir çıktı alabilirsiniz:

Vesselam.

3 Beğeni

Bu konu son yanıttan 10 gün sonra otomatik olarak kapatıldı. Yeni yanıt girilmesine izin verilmiyor.