id: sync dictionaries to version v2.3.0 (2022.09.21)

In the dictionary file we add 15773 new root words, sort them out to
simplify search and update in the future.

In the affix file we fix some format for Lucene.

The README updated to match with upstream [1].

[1] https://github.com/shuLhan/hunspell-id

Change-Id: Ie96776aba2399b90cfbc113782c720a157458bc3
Reviewed-on: https://gerrit.libreoffice.org/c/dictionaries/+/140263
Tested-by: Aron Budea <aron.budea@collabora.com>
Reviewed-by: Aron Budea <aron.budea@collabora.com>
This commit is contained in:
Shulhan
2022-09-21 02:13:55 +07:00
committed by Aron Budea
parent f191df0599
commit 40580c5dbb
6 changed files with 18048 additions and 2188 deletions

View File

@ -14,7 +14,7 @@ $(eval $(call gb_Dictionary_add_root_files,dict-id,\
dictionaries/id/LICENSE-thes\
dictionaries/id/id_ID.aff \
dictionaries/id/id_ID.dic \
dictionaries/id/README-dict.md \
dictionaries/id/README-dict.adoc \
dictionaries/id/README-thes \
))

137
id/README-dict.adoc Normal file
View File

@ -0,0 +1,137 @@
= hunspell-id
:toc:
:sectanchors:
:sectlinks:
Proyek ini adalah kelanjutan dari ekstensi Kamus Indonesia pada
https://extensions.libreoffice.org/extension-center/indonesian-dictionary-kamus-indonesia-by-benitius/releases/2.0[LibreOffice^].
== Unduh
Unduh arsip zip yang terbaru lewat tautan berikut
https://github.com/shuLhan/hunspell-id/archive/master.zip[master.zip^],
atau salin dengan `git`
----
$ git clone git@github.com:shuLhan/hunspell-id.git
----
Jika mengunduh arsip zip, ekstrak berkas zip tersebut.
== Pasang
=== Sistem Operasi GNU/Linux atau BSD
Langkah pemasangan secara manual,
$ sudo make install
Perintah tersebut juga mengikutkan pemasangan berkas eja untuk program myspell
dan vim.
Untuk menghapus kembali pemasangan, lakukan
$ sudo make uninstall
Paket untuk GNU/Linux tersedia sebagai berikut.
Arch Linux:: Pengguna Arch dapat memasang paket ini lewat
git submodule dalam direktori AUR atau
https://aur.archlinux.org/packages/hunspell-id-git/[AUR^].
Debian (dan turunan):: Lihat dalam direktori debian.
Solus:: Paket ini dapat dipasang dengan cara,
+
--
----
$ sudo eopkg it hunspell-id
----
--
=== Ekstensi LibreOffice
Pindah ke direktori sumber repositori,
----
$ cd hunspell-id
----
Eksekusi skrip `build.sh` pada direktori sumber
----
$ ./build.sh
----
Skrip tersebut akan menghasilkan berkas `hunspell-id.oxt`.
Buka pengatur berkas, dan klik dua kali pada berkas `hunspell-id.oxt`, nanti
layanan pemasangan ekstensi LibreOffice akan muncul.
=== Vim
Buat direktori `$HOME/.vim/spell`, kemudian salin atau buat _symlink_ dari
berkas `vim/id.utf-8.spl` ke dalam direktori tersebut.
== Sejarah
Versi 1.0, 1.1, dan 1.2 diciptakan tahun 2004 dengan bantuan Kurniadi dan
Volker Mueller serta Arno Brevoort, yang menyumbangkan daftar kata mereka
sebagai dasar penyusunan berkas tersebut bagi program MySpell, yang dipakai
oleh OpenOffice.org.
Sesudah itu bertahun-tahun lamanya tidak dikerjakan lagi.
Tanggal 05 Mei 2009 Ammar Shadiq menuangkan berkas-berkas lama itu dalam
bentuk ekstensi bagi OpenOffice.
Ekstensi yang sama ini diunggah ke LibreOffice pada tanggal 19 Mei 2012
sebagai Indonesian dictionary - Kamus Indonesia 1.0.
Viko Adi Rahmawan kemudian menguji ekstensi ini kembali dan pada tanggal 16
Mei 2014 diterbitkan sebagai Indonesian dictionary - Kamus Indonesia 1.1 bagi
LibreOffice 4.0.
Versi 2.0 merupakan pengerjaan ulang dari kedua berkas `id_ID.dic` dan
`id_ID.aff` agar lebih sesuai dengan sifat Bahasa Indonesia.
Berkas .aff (affiks) diperbaharui sehingga jauh lebih sesuai
dengan sifat bahasa Indonesia dengan awalan, akhiran dan imbuhan.
Berkas .dic (daftar kata) diperiksa dengan semua lemma dari Kamus Besar Bahasa
Indonesia, edisi 3.
Berkas hyphenator tidak mengalami perubahan.
== Lisensi
----
Copyright (C) 2004-2022 hunspell-id Authors
This program is free software: you can redistribute it and/or modify
it under the terms of the GNU Lesser General Public License as published by
the Free Software Foundation, either version 3 of the License, or
(at your option) any later version, with the additional exemption that
compiling, linking, and/or using OpenSSL is allowed.
This program is distributed in the hope that it will be useful,
but WITHOUT ANY WARRANTY; without even the implied warranty of
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
GNU Lesser General Public License for more details.
You should have received a copy of the GNU Lesser General Public License
along with this program. If not, see <http://www.gnu.org/licenses/>.
A copy of the GNU Lesser General Public License is in the file COPYING.
----
Daftar pengembang yang diketahui (diurut berdasarkan abjad),
* Ammar Shadiq
* Andika Triwidada (Untuk paket Debian)
* Arno Brevoort
* Benitius Brevoort
* Kurniadi
* Viko Adi Rahmawan
* Volker Mueller
* Yurizal Susanto (Untuk paket Solus)
Jika Anda pernah berkontribusi sebelumnya tapi tidak tercantum di sini
silahkan kirim email ke ms@kilabit.info.
// SPDX-FileCopyrightText: 2015 hunspell-id Authors
// SPDX-License-Identifier: LGPL-3.0-only

View File

@ -1,55 +0,0 @@
Proyek ini adalah kelanjutan dari ekstensi Kamus Indonesia pada [Libre Office](http://extensions.libreoffice.org/extension-center/indonesian-dictionary-kamus-indonesia-by-benitius/releases/2.0).
# Pembuatan
* Unduh sumber repositori lewat
* https://github.com/shuLhan/hunspell-id/archive/master.zip, atau
* gandakan dengan git
```
$ git clone git@github.com:shuLhan/hunspell-id.git
```
* Jika mengunduh zip, ekstrak berkas zip tersebut.
## Extensi untuk LibreOffice
* Pindah ke direktori sumber repositori
```
$ cd hunspell-id
```
* Eksekusi skrip `build.sh` pada direktori sumber
```
$ ./build.sh
```
* Skrip tersebut akan menghasilkan berkas `hunspell-id.oxt` di direktori sekarang.
* Buka pengatur berkas, dan klik dua kali pada berkas `hunspell-id.oxt` tersebut, maka nanti layanan pemasangan ekstensi LibreOffice akan muncul.
# Pemasangan
## Sistem Operasi GNU/Linux
* Login sebagai root
* Buat `symlink` dari hasil ekstraksi ke folder sistem hunspell Anda. Contoh,
```
$ cd /usr/share/hunspell
$ ln -s ~/Downloads/hunspell-di/id_ID.aff
$ ln -s ~/Downloads/hunspell-di/id_ID.dic
```
* atau buat salinan langsung.
## Paket GNU/Linux
* Arch Linux: https://aur.archlinux.org/packages/hunspell-id-git/
* Solus: `sudo eopkg it hunspell-id`
# Kredit
* Benitius Brevoort
* Viko Adi Rahmawan
* Ammar Shadiq
* Arno Brevoort
* Volker Mueller
* Kurniadi
# Sejarah Pembuatan
Versi 1.0, 1.1, dan 1.2 diciptakan tahun 2004 dengan bantuan Kurniadi dan Volker Mueller serta Arno Brevoort, yang menyumbangkan daftar kata mereka sebagai dasar penyusunan berkas tersebut bagi program MySpell, yang dipakai oleh OpenOffice.org. Sesudah itu bertahun-tahun lamanya tidak dikerjakan lagi.
Tanggal 05 Mei 2009 Ammar Shadiq menuangkan berkas-berkas lama itu dalam bentuk ekstensi bagi OpenOffice dan mengunggahnya ke sana. Ekstensi yang sama ini diunggah ke LibreOffice pada tanggal 19 Mei 2012 sebagai Indonesian dictionary - Kamus Indonesia 1.0. Viko Adi Rahmawan kemudian menguji ekstensi ini kembali dan pada tanggal 16 Mei 2014 diterbitkan sebagai Indonesian dictionary - Kamus Indonesia 1.1 bagi LibreOffice 4.0.
Versi 2.0 merupakan pengerjaan ulang dari kedua berkas `id_ID.dic` dan `id_ID.aff` agar lebih sesuai dengan sifat Bahasa Indonesia. Berkas .aff (affiks) diperbaharui samasekali, sehingga jauh lebih sesuai dengan sifat bahasa Indonesia dengan awalan, akhiran dan imbuhan. Berkas .dic (daftar kata) diperiksa dengan semua lemma dari Kamus Besar Bahasa Indonesia, edisi 3. Berkas hyphenator tidak mengalami perubahan.

View File

@ -1,6 +1,6 @@
<?xml version="1.0" encoding="UTF-8"?>
<description xmlns="http://openoffice.org/extensions/description/2006" xmlns:d="http://openoffice.org/extensions/description/2006" xmlns:xlink="http://www.w3.org/1999/xlink">
<version value="2018.03.08" />
<version value="2022.09.21" />
<identifier value="org.openoffice.id.hunspell.dictionaries" />
<display-name>
<name lang="en-US">Indonesian spelling dictionary, hyphenation rules, and thesaurus</name>

View File

@ -1,3 +1,6 @@
## SPDX-FileCopyrightText: 2022 hunspell-id Authors
## SPDX-License-Identifier: LGPL-3.0-only
# Affix file for Indonesian dictionary version 2
# Based on version 1, built from scratch for Myspell.
# Released under GPL on 30 January 2004
@ -38,8 +41,10 @@ SET ISO8859-1
TRY aeinrstkumlgopbdhjcyfwzqvxAEINRSTKUMLGOPBDHJCYFWZQVX
WORDCHARS -
FLAG long
CIRCUMFIX A1 # untuk bentuk awalan-akhiran terikat (ber-an)
NEEDAFFIX A2 # jenis membesituakan (jangan besitua tersendiri)
# untuk bentuk awalan-akhiran terikat (ber-an)
CIRCUMFIX A1
# jenis membesituakan (jangan besitua tersendiri)
NEEDAFFIX A2
# Berikut PREFIX dan SIRKUMFIKS
@ -342,11 +347,11 @@ SFX Mx 0 kan/M7n0A1 .
PFX O0 Y 2 # ku- kau-
PFX O0 0 ku .
PFX O0 0 kau
PFX O0 0 kau .
PFX O1 Y 2 # ku- kau-
PFX O1 0 ku/A1 .
PFX O1 0 kau/A1
PFX O1 0 kau/A1 .
SFX Oi Y 1 # -i (ku-i kau-i)
SFX Oi 0 i/O1A1 .
@ -680,70 +685,70 @@ SFX We 0 an/W3o0A1 .
# Berikut ini semua akhiran
SFX a0 Y 14 # -an
SFX a0 0 an .
SFX a0 0 anlah
SFX a0 0 ankah
SFX a0 0 anku
SFX a0 0 anmu
SFX a0 0 annya
SFX a0 0 annyalah
SFX a0 0 annyakah
SFX a0 0 anKu
SFX a0 0 anMu
SFX a0 0 anNya
SFX a0 0 an-Ku
SFX a0 0 an-Mu
SFX a0 0 an-Nya
SFX a0 Y 14 # -an
SFX a0 0 an .
SFX a0 0 anlah .
SFX a0 0 ankah .
SFX a0 0 anku .
SFX a0 0 anmu .
SFX a0 0 annya .
SFX a0 0 annyalah .
SFX a0 0 annyakah .
SFX a0 0 anKu .
SFX a0 0 anMu .
SFX a0 0 anNya .
SFX a0 0 an-Ku .
SFX a0 0 an-Mu .
SFX a0 0 an-Nya .
SFX i0 Y 4 # -i -ilah -ikah
SFX i0 0 i .
SFX i0 0 ilah
SFX i0 0 ikah
SFX i0 0 i/n0
SFX i0 0 ilah .
SFX i0 0 ikah .
SFX i0 0 i/n0 .
SFX k0 Y 3 # -kan
SFX k0 0 kan .
SFX k0 0 kanlah
SFX k0 0 kankah
SFX k0 Y 3 # -kan
SFX k0 0 kan .
SFX k0 0 kanlah .
SFX k0 0 kankah .
SFX l0 Y 2 # -lah -kah
SFX l0 0 lah .
SFX l0 0 kah
SFX l0 0 kah .
SFX n0 Y 4 # -nya, -nyakah, -nyalah
SFX n0 0 nya .
SFX n0 0 nyalah
SFX n0 0 nyakah
SFX n0 0 -Nya
SFX n0 0 nyalah .
SFX n0 0 nyakah .
SFX n0 0 -Nya .
# pengganti orang bagi kata kerja berbentuk di- (diambilnyalah)
SFX nl Y 7 # -lah -kah -nya -nyalah -nyakah -Nya --Nya
SFX nl 0 lah .
SFX nl 0 kah
SFX nl 0 nya
SFX nl 0 nyalah
SFX nl 0 nyakah
SFX nl 0 Nya
SFX nl 0 -Nya
SFX nl 0 kah .
SFX nl 0 nya .
SFX nl 0 nyalah .
SFX nl 0 nyakah .
SFX nl 0 Nya .
SFX nl 0 -Nya .
# akhiran pengganti orang
SFX o0 Y 15 # -ku -mu -nya -Ku -Mu -Nya --Ku --Mu --Nya
SFX o0 0 ku .
SFX o0 0 kulah
SFX o0 0 kukah
SFX o0 0 mu
SFX o0 0 mulah
SFX o0 0 mukah
SFX o0 0 nya
SFX o0 0 nyalah
SFX o0 0 nyakah
SFX o0 0 Ku
SFX o0 0 Mu
SFX o0 0 Nya
SFX o0 0 -Ku
SFX o0 0 -Mu
SFX o0 0 -Nya
SFX o0 0 ku .
SFX o0 0 kulah .
SFX o0 0 kukah .
SFX o0 0 mu .
SFX o0 0 mulah .
SFX o0 0 mukah .
SFX o0 0 nya .
SFX o0 0 nyalah .
SFX o0 0 nyakah .
SFX o0 0 Ku .
SFX o0 0 Mu .
SFX o0 0 Nya .
SFX o0 0 -Ku .
SFX o0 0 -Mu .
SFX o0 0 -Nya .
# REP untuk mengganti huruf yang salah tek, demi sugesti benar
REP 12

19933
id/id_ID.dic

File diff suppressed because it is too large Load Diff