Skip to content
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
145 changes: 73 additions & 72 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -11,80 +11,81 @@ Language Detection Library for Java

## Language Support

### 72 Built-in Language Profiles
### 73 Built-in Language Profiles

1. af Afrikaans
1. an Aragonese
1. ar Arabic
1. ast Asturian
1. be Belarusian
1. br Breton
1. ca Catalan
1. bg Bulgarian
1. bn Bengali
1. cs Czech
1. cy Welsh
1. da Danish
1. de German
1. el Greek
1. en English
1. es Spanish
1. et Estonian
1. eu Basque
1. fa Persian
1. fi Finnish
1. fr French
1. ga Irish
1. gl Galician
1. gu Gujarati
1. he Hebrew
1. hi Hindi
1. hr Croatian
1. ht Haitian
1. hu Hungarian
1. id Indonesian
1. is Icelandic
1. it Italian
1. ja Japanese
1. km Khmer
1. kn Kannada
1. ko Korean
1. lt Lithuanian
1. lv Latvian
1. mk Macedonian
1. ml Malayalam
1. mr Marathi
1. ms Malay
1. mt Maltese
1. ne Nepali
1. nl Dutch
1. no Norwegian
1. oc Occitan
1. pa Punjabi
1. pl Polish
1. pt Portuguese
1. ro Romanian
1. ru Russian
1. sk Slovak
1. sl Slovene
1. so Somali
1. sq Albanian
1. sr Serbian
1. sv Swedish
1. sw Swahili
1. ta Tamil
1. te Telugu
1. th Thai
1. ti Tigrinya
1. tl Tagalog
1. tr Turkish
1. uk Ukrainian
1. ur Urdu
1. vi Vietnamese
1. wa Walloon
1. yi Yiddish
1. zh-cn Simplified Chinese
1. zh-tw Traditional Chinese
2. an Aragonese
3. ar Arabic
4. ast Asturian
5. be Belarusian
6. br Breton
7. ca Catalan
8. bg Bulgarian
9. bn Bengali
10. cs Czech
11. cy Welsh
12. da Danish
13. de German
14. el Greek
15. en English
16. es Spanish
17. et Estonian
18. eu Basque
19. fa Persian
20. fi Finnish
21. fr French
22. ga Irish
23. gl Galician
24. gu Gujarati
25. he Hebrew
26. hi Hindi
27. hr Croatian
28. ht Haitian
29. hu Hungarian
30. id Indonesian
31. is Icelandic
32. it Italian
33. ja Japanese
34. km Khmer
35. kn Kannada
36. ko Korean
37. lt Lithuanian
38. lv Latvian
39. mk Macedonian
40. ml Malayalam
41. mr Marathi
42. ms Malay
43. mt Maltese
44. ne Nepali
45. nl Dutch
46. no Norwegian
47. oc Occitan
48. pa Punjabi
49. pl Polish
50. pt Portuguese
51. ro Romanian
52. ru Russian
53. sk Slovak
54. sl Slovene
55. so Somali
56. sq Albanian
57. sr Serbian
58. sv Swedish
59. sw Swahili
60. ta Tamil
61. te Telugu
62. th Thai
63. tl Tagalog
64. tig Tigre
65. ti Tigrinya
66. tr Turkish
67. uk Ukrainian
68. ur Urdu
69. vi Vietnamese
70. wa Walloon
71. yi Yiddish
72. zh-cn Simplified Chinese
73. zh-tw Traditional Chinese

User danielnaber has made available a profile for Esperanto on his website, see open tasks.

Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -97,6 +97,7 @@ public class BuiltInLanguages {
names.add(LdLocale.fromString("te"));
names.add(LdLocale.fromString("th"));
names.add(LdLocale.fromString("ti"));
names.add(LdLocale.fromString("tig"));
names.add(LdLocale.fromString("tl"));
names.add(LdLocale.fromString("tr"));
names.add(LdLocale.fromString("uk"));
Expand Down
1 change: 1 addition & 0 deletions src/main/resources/languages/tig

Large diffs are not rendered by default.

Original file line number Diff line number Diff line change
Expand Up @@ -86,6 +86,7 @@ protected Object[][] shortCleanTexts() {
{"bg", shortCleanText("Европа не трябва да стартира нов конкурентен маратон и изход с приватизация")},
{"wa", shortCleanText("Çouchal c' est on tecse pår e walon.")},
{"ti", shortCleanText("እዚ ብትግርኛ እተጻሕፈ ጽሑፍ እዩ።")},
{"tig", shortCleanText("ከሰፍሐት ፈን ወዓዳት እሊ እት አክትበት በዲር ለህለ ርዝቅ ህግያነ ክሉ አዳም ጀላብ እግል ልርከቡ፡ እትሊ ዓሙድ እሊ ምነ ብዞሕ ጽበጥለ አክትበት ዲብ ለሐሬ ቀድም እኩም ህለ።")}
};
}

Expand All @@ -99,7 +100,8 @@ protected Object[][] longerWikipediaTexts() {
{"de", largeText(readText("/texts/de-wikipedia-Deutschland.txt"))},
{"fr", largeText(readText("/texts/fr-wikipedia-France.txt"))},
{"it", largeText(readText("/texts/it-wikipedia-Italia.txt"))},
{"ti", largeText(readText("/texts/ti-Haddas-Ertra-Tigrinya.txt"))}
{"ti", largeText(readText("/texts/ti-Haddas-Ertra-Tigrinya.txt"))},
{"tig", largeText(readText("/texts/tig-EritreaHaddas-Tigre.txt"))}
};
}

Expand Down
29 changes: 29 additions & 0 deletions src/test/resources/texts/tig-EritreaHaddas-Tigre.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,29 @@
አድግ አለቡ አድግ ገብእ፦ መርትዓይ ወመዓርፋይ አለቡ ክሉ ጸገም ዲብ መሸንገሉ ክምሰልቱ ተአፍህም።

አድግ ምን መሐገዝ ለአረቴዕ።

ሐቆ አድግ አለብከ ህዬ ኖስከ አካን አድግ ትከሬዕ።

ምስል ናይ ደዓም እት ልትርኤ፡ ዮም ዓመት መታበዐት ቀደም ወሊድ ለወደየ ዐመሲ 11%፡ እት ዕያደት ዐዲተከሌዛን ናይለ ትፈረጀየ እማት ህዬ 5% ዐቦት ክምሰል ሰጀለ ለሸርሐ ነርስ ሳሙኤል፡ እለ ፍገሪት እለ ዐመሲ ለጸነሐ እተ አካን ሰበት ሸቄት ክምቱ ሐበረ።

እሊ ሸዕብየት ናይ ሰልፍ ድጌ ለአሰሰት እቱ ድዋራት ሚ መስል፡ መካሪቱ አድብሩ ወመሓዛቱ ሚ ለትመስል እስራተጅየት ክምሰልተ እግል ልርኤ፡ ፋሕ ለመካትብ ተንዚም ለዐለ እቱ፡ ለሳልፋይ ሙእተመር ጀብሀት ሸዕብየት ለገብአ ዲቡ ለቀደም 41 ሰነት እለ ዮም አብ አምነ እግል ሐድ 30 ሰነት ካድም ዲበ ለሀለ ሬድዮ ክርን ገቢል፡ ዲብ ሄለል ወርሕ ሐቴ ናይ 1979 ለተአሰሰት ዲቡ ወክርን ዐዳለት ወአማን ለአስመዐት ምኑ ፋሕ፡ ብሌቃት ለሀይአት ተድሪብ ፊተውራሪ ወአዋልድ ክምሰሁመ ከረ አምን ሰውረት ወብዕድ አሳስ መሳኔዕ ለዐለ እተ አካን፡ ዜሮ፡ ለአሳስ ደረሰ መድረሰት ሰውረት፡ እለን ክም ሐለፍከ ለትረክበን ደብዐት፡ ሰበር ቀጤ ወዐገት መሳክብ እስብዳልያት፡ ወገራጃት ክም ዐለ እብ ታሪክ አምሩ ምንመ ዐለ፡ እግል ሰልፍ መደቱቱ ካይዱ ለዐለ።

ለጅነ ለጸሊም እብ እንክሩ እንዴ ኢልትሀለግ፡ “እንተ ህዬ ቀደም ዶልከ እንዴ ኢትበሽል ሰበት ትወለድካ ክእነ ፈጭሕ ለገብአከ?” እት ልብል እግል ሰኣሉ እብ ሰኣል በልሰዩ ዲቡ ልትበሀል።

ሐቴ ምዕል አቅሕሞተት ሰበት ጸምአት እግል ትስቴ ማይ ለትረክብ ዲበ አካን እ ንዴ ተአትቃምት፡ ሐንቴ ዕጨት በጥረት።

ሰኣል፡ እት ዕቅበት ሰዋልፍ ወዐዋዲ መጅተምዖም ህዬ ለሸባብ እንሰር ከአፎ ህለው?

በሊስ፡ ሐቴ ምነ ሸቁ ዲቡ ሰዳይት ዓይላት ሹሀዳ ተ፡ ሹሀደ ጀላነ ፍዘ ገብአው፡ እንተ ህዬ ዲብ ግራሆም ሚ ተአወቄ ቱ ለልትረኤ። እት ክል ዕዱ ሸባብ ምን 10 አስክ 20 ነቅፈ እት ክል ወሬሕ እግል ትትፋገር ወትትጀመዕ ከሐሬ እግል ዓይላት ሹሀደእ እግል ትግበእ። እግል እሊ ሓክም አቅሊም ሰፊር መ/ስዒድ መንታይ፡ ምስል ፈሬዕ ውዛረት ዐመል ወደማነት እጅትማዕየት እንዴ ትፋሀመ፡ ሕሳብ ፍንቱይ ለዲቡ እንከርየ አክሰተ እግልነ። እብ ምዴርየት ዐሰብ ነአንብት እንቤ ወ15 ሕጉዛት ዓይላት ጸበጥነ።

ደሀይ መሕበር እት ምዴርየት ባጽዕ ሚ መስል?

ወድ ኣደሚ ምነ እምበል ማል ሐቴ እግል ልትጸገሞ ሊቀድሮ ወምነ እብ ማል ሌጠ እግል ልትጻገሞ ለቀድሮ ውዘረ ሕሳቡ እግል ሊዴ ብዲቡ።

ሓጥር ግበእ ወእለ ኢገብአከ ምን ገብእመ፡ ሓጥር ክም እንተ አተምስል ዎሮትመ ለልአምር እብከ አለቡ።

ነፈዕ ወድ ዕትማን ወኢኖ ሊትማን እብ ክሱስ ሐልየት፡ ዓዳት ወአድጋማት ትግሬ እተ ወደዉ በሐስ ወድራሳት፡ ክምሰልሁመ እት ደረጀት ጥባዐት ለአብጸሐዉ፡ ዮም ክብት ትግራይት ጋብእ ለህለ አክትበት፡ እግለ መጽእ አጅያል ህግየ ትግሬ ዝሕረት ዐባይ ቱ። ነፈዕ ወድ ዕትማን ወኢኖ ሊትማን ህዬ ዲብ ተእሪክ፡ ዓዳትነ ወሕላይነ ለአግደዉ ዶር እብ ቀሊል ለልትረኤ ኢኮን። ከሰፍሐት ፈን ወዓዳት እሊ እት አክትበት በዲር ለህለ ርዝቅ ህግያነ ክሉ አዳም ጀላብ እግል ልርከቡ፡ እትሊ ዓሙድ እሊ ምነ ብዞሕ ጽበጥለ አክትበት ዲብ ለሐሬ ቀድም እኩም ህለ።

ቢንያም እት ሕንጣጥ ዐውቴ

እት ታሪክ ጅግረ ዐጀላት ኤረትርየ ምንተሐት 23 ሰነት ዲብ ሻምፕዮን ዐለም፡ ቀደም እለ መዳልየት ወርቅ ለናስእ ቢንያም ግርማይ፡ ለሐልፈት ጅምዐት ዲብ ስፐይን እተገብአ ናይ ሐቴ ምዕል ጅግረ ‘ትሮፍዮ አልኩዳይ አው ፖርት ዲ አልኩዳይ፡ አወላይ እንዴ ፈግረ ጅበት ሐበን ላብስ ሀለ።