Memanipulasi teks Yiddish bawah sistem operasi Unix

Penulis:. Raphael Finkel email (tanpa garis bawah), web .

Pilihan

Untuk menulis Yiddish di Unix, Anda memiliki pilihan ini:

  1. Menulis di YIVO transliterasi dan mengkonversi, jika Anda ingin, untuk beberapa bentuk lainnya dengan menggunakan shraybmashinke .
  2. Menulis langsung di Unicode, menyimpan file Anda dalam UTF-8 format.

Catatan ini berkonsentrasi pada cara-cara untuk melakukan yang terakhir. Anda benar-benar ingin menggunakan Unicode dalam jangka panjang, karena memungkinkan Anda untuk menggabungkan beberapa bahasa ke dalam satu dokumen, dan mendefinisikan format presentasi, khususnya, tata letak dua arah.

Masalah

  • Apa tingkat perangkat lunak yang konversi keystroke untuk representasi karakter dicapai?
    • Dalam Unix "konsol mode", driver perangkat tidak pemetaan.
    • Dalam Unix "X-windows masukan", server X memiliki meja keymap untuk mengkonversi acara keycodes (peristiwa penting-tekan) ke Keysyms. Ada daftar Keysyms di include / X11 / keysymdef.h , yang datang dengan distribusi X; mendefinisikan Arab, Thailand, Ibrani, dan Keysyms lainnya. Daftar Ibrani hilang karakter Yiddish khusus. Saya tidak menyarankan Anda bermain dengan bahasa Ibrani atau Keysyms Yiddish; nilai-nilai Keysym adalah X-Windows tertentu dan tidak sesuai dengan Unicode. Namun, beberapa aplikasi (seperti xterm) memahami Keysym dari bentuk 0x100XXXX sebagai karakter XXXX Unicode UCS-2.
    • Anda dapat mengaktifkan ekstensi Keyboard X ( xkb ) untuk membiarkan Anda beralih di antara layout keyboard dan menafsirkan keystrokes Anda sebagai Yiddish dalam tata letak yang tepat.
    • Anda dapat menggunakan Ibus, Scim, metode UIM. Pada Debian (termasuk Ubuntu) instalasi, gunakan apt-get untuk mendapatkan paket ini: ibus , ibus-m17n , libm17n-0 , m17n-contrib , ibus-gtk . Jalankan ibus-pengaturan dan memilih Yiddish-yivo (m17n) sebagai metode input. Sekarang setiap program yang menggunakan Ibus dapat mengambil input; Anda beralih antara input biasa dan Ibus dengan (Anda dapat menyesuaikan itu).
    • Jika Anda lebih memilih layout keyboard Yankl Halpern ini , Anda bisa ambil file ini dan menginstalnya di direktori dicetak dengan menjalankan / usr / bin / m17n-db(Anda harus melakukannya sebagai root). Maka Anda harus menjalankan ibus-daemon -d --xim --cache penyegaran (seperti dirimu sendiri).
    • Anda dapat memperkenalkan metode input X (XIM). Beberapa aplikasi X-windows dapat menggunakan teknik ini.
    • Anda dapat memperkenalkan metode input ke perpustakaan gtk +. Metode seperti kemudian dapat diaktifkan pada aplikasi gnome, seperti gedit . Metode input memungkinkan terjemahan multiple-key konteks-sensitif.
    • Aplikasi seperti Yudit dan Vim dapat menerapkan pemetaan mereka sendiri.
  • Dapatkah pengguna mengkonfigurasi pemetaan? Dalam Unix "X-windows masukan", yang xmodmap Program dapat memodifikasi tabel keymap. The xkeycaps Program dapat membantu Anda mengatur konfigurasi xmodmap Anda secara interaktif. Demikian pula, beberapa aplikasi X berbasis X-sumber daya, khususnya xterm (terminal emulator), dapat dikonfigurasi untuk menerjemahkan kunci tertentu dalam mode yang diinginkan. Dalam banyak kasus, meskipun, Anda perlu izin khusus untuk memodifikasi file konfigurasi.
  • Dapatkah pengguna dengan mudah beralih dari satu pemetaan yang lain? Dalam Unix, xmodmap dapat mengubah tabel keymap pada fly (mempengaruhi semua aplikasi). Pemetaan-X-aplikasi tertentu umumnya dimuat hanya ketika aplikasi dimulai. Namun, xterm memungkinkan untuk kunci yang akan dipetakan ke fungsi seperti "beralih ke peta dimuat berbeda". XKBmemungkinkan Anda membentuk kelompok kunci atau kunci yang memungkinkan Anda beralih layout. Ibus memungkinkan Anda beralih di antara metode input. Yudit tidak pemetaan sendiri, dan switch keystroke tunggal dari satu ke yang lain. Vim melakukan pemetaan sendiri, dan perintah sederhana (yang dapat dipetakan ke sebuah keystroke) beralih dari satu ke yang lain.
  • Apakah pemetaan memungkinkan terjemahan multiple-key? Ketika saya ketik Yiddish, saya ingin "w" menjadi shin, tapi saya juga ingin "sh" menjadi shin, karena bahasa ibu saya adalah bahasa Inggris. Saya ingin "n," untuk memberikan biarawati akhir dan koma. Dalam Unix, terjemahan multiple-key tidak tersedia di kernel atau X-jendela tingkat (sejauh yang saya tahu), tetapi mereka mungkin dalam Ibus, gtk + masukan modul, dan beberapa aplikasi, khususnya, Yudit dan Vim .
  • Apakah Unicode (UTF-8) yang format untuk penyimpanan data? Pertanyaan ini biasanya aplikasi-dependent. Dalam Unix, Yudit hanya menggunakan Unicode, dan Vim dapat diatur untuk menggunakan Unicode (dan menerjemahkan ke dari pengkodean lainnya). Dalam varian Linux dari Unix, di "console mode", aplikasi menerima karakter Unicode (saya pikir).
  • Apakah ada font yang benar menampilkan Unicode, khususnya huruf Yiddish-spesifik seperti pasekh-tsvey-yudn? Sejak tahun 2000, jawabannya telah menjadi semakin afirmatif pada semua platform. Lihat font , di bawah ini.
  • Apakah mesin display dan editor benar menangani menyusun karakter? Di Unix, server X-Windows tampaknya tidak memiliki dukungan seperti itu, tetapi beberapa aplikasi (sepertixterm dan Yudit ) display setara pragubah karakter mana yang tersedia dan menggunakan superposisi sederhana sebaliknya. Gvim (yang versi grafis dari vim yang melewati xterm ) hanya menggunakan superposisi. vim mengerti sifat 0-lebar komposisi (berhubungan dengan font monospace saja, dan keselarasan vertikal itu penting).
  • Apakah mesin display menangani bidirectionality ? Ada beberapa tingkat kemampuan: (a) tidak ada dukungan, (b) seluruh jendela dapat ditetapkan secara manual untuk RTL, (c) sebuah fragmen dari teks dalam jendela dapat ditetapkan secara manual untuk RTL, (d) semua teks otomatis ditampilkan menurut dua arah (BIDI) algoritma penuh. Biasanya menampilkan mesin adalah bagian dari aplikasi tingkat atas (yaitu, di Unix, ketika saya menggunakan Vim melalui xterm melalui X-Windows melalui OS, itu adalah Vim yang memutuskan bagaimana lay out karakter. Menurunkan kadar menawarkan tidak ada dukungan) . Status saat ini (2003) di Unix adalah bahwa Vim menggunakan metode (b), Yudit dan AbiWord metode (d).
  • Apakah mungkin untuk ? Langsung memasukkan nilai Unicode beberapa aplikasi memiliki kemampuan ini: Vim (Anda ketik  u05d7 untuk mendapatkan khes a) dan Yudit(Anda beralih ke "unicode" keymap dan ketik u05d7 ). Hal ini tidak didukung di tingkat bawah (belum).
  • Apakah ada aplikasi-independen prosesor front-end yang dapat mengkonversi penekanan tombol menjadi karakter Unicode untuk aplikasi apa pun yang sedang berjalan? Dalam X-Windows, prosesor tersebut disebut Metode X Input (XIM). Banyak aplikasi, termasuk gvim, AbiWord , dan Yudit, dapat dilampirkan ke XIM; Yudit dapat beralih di antara beberapa XIMs selama sesi. Saya telah membangun XIM Yiddish, tetapi hanya berhasil berbicara dengan AbiWord .
  • Apakah mungkin untuk internasionalisasi aplikasi, yang, memiliki pesan kesalahan, layar bantuan, dan tombol label dalam bahasa favorit Anda? Dalam Unix, program dikompilasi dengan libintl bisa internasionalisasi. Saya telah menulis terjemahan yang diperlukan untuk Yudit ( screenshot ) dan untuk AbiWord .
  • Dapat satu memeriksa ejaan , memasukkan daftar ejaan disesuaikan? Di Vim dan AbiWord , jawabannya adalah ya, baik di diromanisasi dan Unicode Yiddish. Saya telah membangun daftar ejaan ini.

Fon

Dalam Unix, Anda akan menggunakan Sistem X-Windows. Saya sarankan Anda mendapatkan font Markus Kuhn jika Anda belum memiliki mereka dalam distribusi X-Windows Anda. Mereka hadir di X11R6.4. The -misc-fixed-menengah-r normal - 20-200-75-75-c-100-iso10646-1 font yang memiliki modifikasi saya untuk membuatnya lengkap dan mudah dibaca untuk Yiddish. Untuk font TrueType, saya sarankan FreeSans.

xkb

Alih-alih menggunakan X-windows keymap, Anda dapat menggunakan ekstensi Keyboard X, yang dikenal sebagai xkb . Fasilitas ini memungkinkan Anda membangun beberapa layout keyboard dan beralih di antara mereka. Fasilitas ini adalah independen dari semua aplikasi X-windows. Ini tidak memberikan Anda beberapa-key terjemahan. Berikut adalah petunjuk untuk Ubuntu Linux.

  1. Pastikan Anda tidak memiliki XKB_DISABLE set variabel lingkungan Anda.
  2. Sebagai root, tambahkan ke / usr / share / X11 / xkb / simbol / kita isi file ini .
  3. Di / usr / share / X11 / xkb / aturan , menempatkan baris berikut di akhir kita: bagian (sekitar garis 269) dari kedua base.lst dan evdev.lst :
     Yiddish kami: Yiddish 
  4. Di / usr / share / X11 / xkb / aturan , menempatkan baris berikut dalam "kita" , di variantList setelah varian fonetik Rusia, di kedua base.xml danevdev.xm: :
            
               
                 Yiddish  
                 Yiddish  
                  yid   
               
            
    
  5. Run setxkbmap kami
  6. Menggunakan gnome-keyboard-sifat , di bawah tab "Layout",
    1. Menambahkan layout: Dengan bahasa → Yiddish → USA Yiddish
    2. Mengatur Layout Options sehingga Anda tahu kunci untuk mengubah tata letak. Anda mungkin ingin menggunakan LED keyboard untuk menunjukkan tata letak alternatif.
  7. Jalankan setxkbmap -Opsi grp: switch, grp: alts_toggle
  8. Anda sekarang dapat menggunakan (1) apa pun yang Anda mengatur pada langkah sebelumnya untuk beralih layout, (2) tombol shift untuk beralih tingkat dan (3) tombol kanan alt untuk beralih kelompok (beberapa tombol memiliki kelompok kedua simbol ). Keyboard terlihat seperti file pdf ini . Jika Anda perlu mengetik huruf non-pragubah, memisahkan suatu alef dari pasekh nya, misalnya, menggunakan vokal diposisikan pada tombol Q atau kelompok-dua simbol pada berbagai tombol lainnya.

xterm

Versi xterm sejak tahun 2000 mengerti UTF-8. Anda bisa mendapatkan xterm dan compile sendiri jika Anda membutuhkan; Anda harus menetapkan./configure --enable-lebar karakter . Keterbatasan / bug: Xterm tidak memiliki dukungan BIDI. Hal menyusun karakter dengan overprinting sederhana kecuali dapat menemukan karakter pragubah. Ini menempatkan karakter pragubah dalam memotong penyangga, tidak posting-terdiri, sebagaimana mestinya. File Pendukung: Anda mungkin ingin menambahkan informasi ini untuk Anda ~ / .Xdefaults berkas untuk mendukung (1) font Unicode bagus (di "media" Font ukuran, dan (2) pengkodean keyboard untuk Yiddish (mengaktifkan / menonaktifkan dengan tombol Mode_switch).

Yudit

Gaspar Sinai Yudit Editor memungkinkan Anda untuk mengedit UTF-8 teks. Berikut adalah screenshot . Saya telah membangun sebuah keyboard mapping untuk itu yang merupakan bagian dari distribusi. Pemetaan ini memiliki prosesor multi-tombol front-end, sehingga Anda dapat mengetik "sh" jika Anda ingin shin a. Pemetaan Yiddish juga menyisipkan alef shtumer setelah spasi sebelum vokal tertentu. Yudit juga bekerja dengan XIM saya. Yudit memiliki mesin display truetype-font sendiri, sehingga Anda tidak harus memiliki satu di X11 Anda. Yudit memiliki internasionalisasi, sehingga Anda dapat memiliki semua pesan Editor disajikan dalam bahasa Yiddish. Yudit tidak display BIDI benar. Anda akan perlu mengatur Anda ~ / .yudit / yudit.properties berkas untuk memiliki garis sesuatu seperti ini:

yudit.default.language = yi 
yudit.editor.font = iso10646 
yudit.editor.fonts = arial, Cyberbit, iso10646, caslr 
yudit.editor.fontsize = 20 | 
yudit.editor.fontsizes = 10,12,14,16,20 , 24 
yudit.editor.input = Yiddish 
yudit.editor.inputs = lurus, unicode, Yiddish, Rusia, Jerman 
yudit.font.arial = arial__h.ttf, cyberbit.ttf 
yudit.font.caslr = caslr.ttf 
yudit.font. Cyberbit = cyberbit.ttf, CyberBitMods.ttf 
yudit.font.iso10646 = -misc-tetap-menengah-r normal - 20-200-75-75-c-100-iso10646-1 
yudit.editor.fonts = arial, Cyberbit, iso10646, caslr

Anda mungkin ingin Cyberbit font. Hal ini hilang beberapa karakter, yang dapat Anda peroleh dengan menambahkan CyberBitMods ke jalur font. Anda mungkin juga ingin font caslr, meskipun tidak secantik untuk Yiddish. Yudit mampu menghasilkan PostScript output. Ada versi Yudit yang berjalan pada platform Win32 yang dapat Anda temukan di sini . Singkat Win32 petunjuk instalasi: (1) Jalankan executable Anda men-download untuk menginstal program (namanya sesuai dengan pola ini: Yudit * .exe (2) Instal font bitmap dengan menjalankan program yang sesuai dengan pola ini: bitmap_fonts * .exe (3 ) Menggunakan editor teks, memodifikasi Program Files \ Yudit \ Config \ yudit.properties sebagai berikut:

yudit.datapath = C: \ Program Files \ Yudit \ data 
yudit.fontpath = C: \ WINNT \ FONT [untuk Win2000] 
yudit.fontpath = C: \ windoes \ FONT [untuk Win98]

Vim

Bram ini Moolenaar Vim Editor versi freeware editor vi yang populer; itu berjalan dengan baik pada kedua Unix dan Win32. Dimulai dengan versi 6.0, memiliki dukungan yang cukup baik untuk Unicode dan Yiddish. Menggunakannya bersama dengan xterm (seperti di atas) atau dalam mode gvim (melewati xterm) untuk mendapatkan manfaat penuh. Berikut adalah screenshot dari antarmuka gvim. Anda tidak perlu karakter hal pemetaan khusus untuk xterm; menggunakan keymap Vim sebagai gantinya. Masukan perintah dalam ~ / vimrc:

setfileencodings = cp1255, utf-8 guifont = 8x13bold encoding = utf-8 
filetype plugin pada 
sintaks di

Anda akan ingin tahu tentang perintah berikut:

: mengatur set rl modus di jendela saat ini untuk RTL 
: mengatur modus set norl di jendela saat ini untuk LTR 
: mengatur keymap = yi beralih ke keymap Yiddish 
: set encoding = utf-8 memungkinkan Vim output baik untuk Anda UTF-8 diaktifkan xterm 
< control - ^> matikan mode input bahasa asing.

Jika Anda berencana untuk mencampur bahasa, saya sarankan Anda menggunakan beberapa jendela, satu dengan rtl dihidupkan, yang lain tanpa. Keterbatasan / bug: Vim tidak memiliki dukungan BIDI dan tidak mungkin untuk mendapatkan. File Pendukung: Dapatkan file ini dan untar di direktori rumah Anda. Ini termasuk periksaejaan untuk diromanisasi dan Unicode Yiddish dan makro Keyboard (penuh prosesor front-end) untuk Unicode Yiddish. Hal ini membutuhkan versi 6.0 minimal. Baca file README (memiliki instruksi untuk Unix dan untuk Win32).

AbiWord

AbiWord adalah (akhirnya) pengolah kata dengan fitur lengkap, tidak hanya editor teks. Menggunakan XML sebagai format file yang disukai, tetapi dapat mengimpor dan mengekspor file berformat dan teks file dalam Unicode. Versi terbaru dari AbiWord pengolah kata menangani BIDI. Mereka juga dapat melakukan Ibrani surat-membentuk, yang berarti bahwa surat-surat akhir secara otomatis dihasilkan, tetapi file yang dihasilkan kemudian berisi medial, surat belum final; meninggalkan fitur ini dimatikan. AbiWord memiliki versi untuk Unix, MacOS, dan Win32;semua memiliki tampilan yang sama dan merasa. Berikut adalah screenshot .

Banyak dari berikut ini adalah usang; AbiWord adalah target bergerak cepat. Hal ini sulit untuk mengatur font untuk AbiWord untuk Unix / X-Windows.

  1. Dalam direktori font-nya (biasanya / usr / share / AbiSuite / font , Anda perlu membangun sebuah subdirektori utf-8.
  2. Masukan salinan atau link ke akal benar-jenis font ada, seperti arial.ttf.
  3. Jalankan ttmkfdir dalam direktori yang (merasa ttmkfdir sini ). Program ini ekstrak nama font dari file ttf dan membangun fonts.scale.
  4. Dalam file yang dihasilkan fonts.scale , membuat satu baris baru untuk setiap font (ada kemungkinan akan sudah ada beberapa dengan nama coding yang sedikit berbeda). Pada baris baru ini, mengatur coding, yang merupakan akhiran -ISO, mengatakan iso10646-1. Akhiran ini mengatakan "Saya font Unicode".
  5. Jalankan mkfontdir dalam direktori tersebut. Program ini dibangun fonts.dir , yang membutuhkan X-Windows untuk memahami isi.
  6. Dalam direktori bin AbiWord ini, biasanya / usr / share / AbiSuite / bin , menjalankanttfadmin.sh / usr / share / AbiSuite / font / utf-8 ISO-10646-1 . Program ini menetapkan file tambahan * .u2g dan * .t42 untuk setiap font. AbiWord membutuhkan file-file tambahan untuk memahami font.
  7. Server X-Windows Anda harus memahami kedua jenis font yang biasanya digunakan oleh AbiWord dan juga True Type font, karena hanya Arial True Type font, sejauh yang saya tahu, banyak tersedia dan mendukung Yiddish. Anda memerlukan setidaknya versi 4.1.0 dari X-Windows. Dalam file konfigurasi (biasanya / etc / XF86Config ), Anda harus memiliki
      Load "type1" 
      beban "xtt"
    
    di bagian "Modul". Jika Anda harus menambahkan baris tersebut, Anda harus me-restart X-Windows untuk memiliki perubahan diterapkan.
  8. Setiap kali Anda menjalankan AbiWord, Anda harus terlebih dahulu menetapkan variabel lingkungan LANG Anda untuk yi.utf-8 . The .utf-8 bagian menunjukkan apa font diatur untuk menggunakan. Bagian pertama mengatakan, "Saya lebih suka Yiddish seluruh".
  9. Ketika Anda membaca dalam sebuah file teks UTF-8, membacanya sebagai jenis disandikan teks, lalu pilih UTF8 encoding dalam dialog yang dihasilkan.
  10. Saya tidak tahu cara yang baik untuk memetakan keyboard. Saya menggunakan xmodmap dan beralih antara bahasa Inggris dan peta Yiddish. Namun, teknik ini mengharuskan Anda menggunakan beberapa penekanan tombol untuk mendapatkan vokal pada alef atau garis di atas beys atau karakter multi-utf8 lainnya. Saya bisa memberikan file xmodmap relevan dan program tk kecil yang memungkinkan Anda alternatif di antara mereka.
  11. Ketika Anda keluar AbiWord, Anda perlu unset variabel LANG dan juga menghapus direktori ekstra dari fontpath Anda yang AbiWord kadang-kadang daun tergeletak di sekitar:xset fp- / usr / share / AbiSuite / font / dan xset fp- / usr / share / AbiSuite / font / utf-8 / .

Saya kerja pada pemeriksa ejaan untuk AbiWord / bahasa Yiddish. Saya memiliki file ejaan cek; meminta saya untuk rincian. Masalah berikut saat ini ada:

  1. Mendapatkan AbiWord untuk memahami file periksa ejaan untuk bahasa seperti bahasa Yiddish yang tidak ada dalam daftar saat ini. Aku hanya menyebut mereka file Finlandia dan mengatur bahasa saya ke Finlandia.
  2. Menu interaktif ketika kesalahan ejaan ditemukan menggunakan font non-utf8, sehingga semua yang Anda lihat adalah omong kosong.

mule

Mule 2.3 adalah perluasan ke Gnu emacs 19,28 Editor. Tidak mendukung unicode, tapi itu tidak mendukung berbagai halaman kode bahasa tertentu. Menggunakan aneh "Junet" format file sendiri untuk file multilanguage. Saya menyarankan Anda untuk menghindarinya.

emacs

Ada eksperimental (10/2003) versi emacs yang menangani UTF8 dan dilaporkan menangani BIDI cukup baik; itu adalah di http://www.m17n.org/emacs-bidi/ . Emacs adalah editor dengan fitur lengkap, namun butuh banyak usaha untuk mempelajarinya. Update (7/2008): sementara dukungan BiDi belum tersedia untuk Emacs (kecuali untuk yang satu eksperimen dan menjalankanemacs -NW (tidak grafis) di terminal emulator BiDi-mampu), Anda dapat menggunakan miskin-mans-bidi .el , yang menjalankan alat baris perintah fribidi atau bidiv sebagai sub proses untuk mengubah masukan logis menjadi output visual dalam buffer cermin. Ada juga metode input untuk Yiddish pada Emacs yang menangani input YIVO-seperti, antara lain, ditulis oleh Niels Giesen. Pada Agustus 2010, sebuah cabang pengembangan Emacs mendukung tampilan dua arah dan obsoletes miskin-Mans-bidi.

KDE

KDE 3 adalah "lingkungan", termasuk window manager dan aplikasi. aplikasi pengolah kata yang disebut KOffice. KOffice mendukung BIDI dan berbagai pengkodean, termasuk Unicode.

Ringkasan

Produk BIDI pemetaan keyboard tingkat editor
xterm tak satupun single-key tidak ada editing
Vim manual dengan penyangga; hanya mempengaruhi tampilan multiple-key; baik transkripsi YIVO editing penuh (menggunakan saya Plugin ejaan-checker untuk diromanisasi atau Unicode Yiddish); teks biasa saja; display monospace hanya
Yudit otomatis; hanya mempengaruhi tampilan multiple-key; baik transkripsi YIVO editing acceptible; teks biasa saja; memungkinkan True Type dan non-monospace font; menghasilkan PostScript.
KOffice ? ? penuh "pengolah kata"; menyisipkan kode Format; dapat output teks biasa atau XML atau beberapa bentuk lain.
AbiWord otomatis; hanya mempengaruhi tampilan tidak penuh "pengolah kata"; menyisipkan kode Format; dapat output teks biasa atau XML atau beberapa bentuk lain.

 

Source: http://www.cs.engr.uky.edu/~raphael/yiddish/unix.html