From cb4505fc3857d976a3cdf84eb115d1bac216bea9 Mon Sep 17 00:00:00 2001 From: "Artur H. Lange" Date: Thu, 31 Aug 2023 16:57:48 +0200 Subject: [PATCH 1/4] Add/update translations --- lib/ProductOpener/Ingredients.pm | 3 +- taxonomies/additives.txt | 2 +- taxonomies/allergens.txt | 4 +- taxonomies/categories.txt | 257 ++++++++++++++++++++++++-- taxonomies/ingredients.txt | 107 ++++++++--- taxonomies/ingredients_processing.txt | 3 +- taxonomies/labels.txt | 2 +- 7 files changed, 336 insertions(+), 42 deletions(-) diff --git a/lib/ProductOpener/Ingredients.pm b/lib/ProductOpener/Ingredients.pm index 0ea9bbda8a9e7..7470ffa2353de 100644 --- a/lib/ProductOpener/Ingredients.pm +++ b/lib/ProductOpener/Ingredients.pm @@ -200,7 +200,7 @@ my %may_contain_regexps = ( "Dit product kan sporen van|bevat mogelijk sporen van|Kan sporen bevatten van|Kan sporen van|bevat mogelijk|sporen van", nb => "kan inneholde spor av|kan forekomme spor av|kan inneholde spor|kan forekomme spor|kan inneholde|kan forekomme", - pl => "może zawierać śladowe ilości|produkt może zawierać|może zawierać|możliwa obecność", + pl => "może zawierać śladowe ilości|produkt może zawierać:?|może zawierać:?|możliwa obecność", pt => "pode conter vestígios de|pode conter", ro => "poate con[țţt]ine urme de|poate con[țţt]ine|poate con[țţt]in", ru => "Могут содержаться следы", @@ -2372,6 +2372,7 @@ sub parse_ingredients_text ($product_ref) { '^czekolada( deserowa)?: masa kakaowa min(imum)?$', '^masa kakaowa( w czekoladzie mlecznej)? min(imum)?$', '^masa mleczna min(imum)?$', + '^zawartość tłuszczu$', '^(?>\d+\s+g\s+)?(?>\w+\s?)*?100\s?g(?> \w*)?$', # "pomidorów zużyto na 100 g produktu" '^\w*\s?z \d* g (?>\w+\s?)*?100\s?g\s(?>produktu)?$' , # "Sporządzono z 40 g owoców na 100 g produktu" diff --git a/taxonomies/additives.txt b/taxonomies/additives.txt index f2bd35e0b810e..643cecea7545f 100644 --- a/taxonomies/additives.txt +++ b/taxonomies/additives.txt @@ -15549,7 +15549,7 @@ nn:E500(ii), natriumvätekarbonat, natriumhydrogenkarbonat oc:E500(ii), Idrogenocarbonat de sòdi or:E500(ii), ସୋଡ଼ିଅମ ବାଇକାର୍ବୋନେଟ pa:E500(ii), ਮਿੱਠਾ ਸੋਡਾ -pl:E500(ii), Wodorowęglan sodu, Diwęglan sodu, kwaśny węglan sodu, diwęglan sodowy +pl:E500(ii), Wodorowęglan sodu, Diwęglan sodu, kwaśny węglan sodu, diwęglan sodowy, soda oczyszczona pt:E500(ii), Hidrogenocarbonato de sódio, Bicarbonato de sódio, carbonato ácido de sódio ro:E500(ii), Bicarbonat de sodiu, Carbonat acid de sodiu, Bicarbonat ru:E500(ii), натрий двууглекислый, бикарбонат натрия, бикарбонат-натрия diff --git a/taxonomies/allergens.txt b/taxonomies/allergens.txt index b8d04be41abed..00633d08c5450 100644 --- a/taxonomies/allergens.txt +++ b/taxonomies/allergens.txt @@ -79,7 +79,7 @@ lt:vėžiagyviai, krabai, krabų, omarai, omarų, vėžiai, krevetės, kreveči lv:vēžveidīgie mt:krustaċej nl:schaaldieren, schaaldier -pl:skorupiaki +pl:skorupiaki, skorupiaków pt:crustáceos, caranguejo, lagosta, lagostim, gambas, gamba, camarão ro:crustacee ru:ракообразные @@ -498,7 +498,7 @@ lv:gliemji mt:molluski nl:weekdieren nl_be:weekdieren -pl:mięczaki +pl:mięczaki, mięczaków pt:moluscos, molusco, lulas, lula, chocos, choco, ostras, ostra, mexilhões, mexilhão, amêijoas, amêijoa, vieiras, vieira ro:moluște ru:моллюск, моллюски, кальмар, каракатица, устрицы, устрица, ракушки, гребешок, улитка, улитки diff --git a/taxonomies/categories.txt b/taxonomies/categories.txt index d667d91fd73a4..492d140e82ea5 100644 --- a/taxonomies/categories.txt +++ b/taxonomies/categories.txt @@ -7298,6 +7298,7 @@ he:משקאות צמחים, משקה צמחים it:Bevande a base di verdure lt:Daržovių gėrimai nl:Groentedranken, Groentedrank, Groentendrank +pl:Napoje na bazie warzyw #Duplicate #he:משקאות צמחים, משקאות מבוססי צמחים, משקה צמחים @@ -7334,6 +7335,7 @@ it:Succo di carota ja:にんじんジュース lt:Morkų sultys nl:Wortelsappen, Wortelsap +pl:Soki marchewkowe ru:Морковные соки tr:Havuç suyu zh:胡萝卜汁 @@ -7421,6 +7423,7 @@ de:Passierte Tomaten fr:Coulis de tomates, coulis de tomate, Coulis de tomate appertisé mi-réduit à 11%, Purée de tomates appertisée mi-réduite à 11% it:Passata nl:Gezeefde tomaten, Passata, Tomatencoulis +pl:Przetarte pomidory, Passata agribalyse_food_code:en:20260 ciqual_food_code:en:20260 ciqual_food_name:en:Tomato coulis, canned (tomato puree semi-reduced 11%) @@ -7466,6 +7469,7 @@ it:Tisane, Infusi ja:ハーブティ, ハーブティー lt:Žolelių arbatos, Žolelių užpilai, užpilai nl:Kruidentheeën, Kruidenthee +pl:Herbaty ziołowe pt:Chás de ervas, infusões de ervas, infusões ru:Травяные чаи и настойки wikidata:en:Q379932 @@ -9054,6 +9058,7 @@ it:Caffè istantaneo ja:インスタントコーヒー lt:Tirpios kavos, tirpi kava, kavos milteliai, tirpios kavos milteliai nl:Oploskoffies, Oploskoffie +pl:Kawa rozpuszczalna, Kawa instant, Kawy rozpuszczalne, Kawy instant pt:Cafés instantâneos ru:Растворимый кофе, кофе растворимый tr:Kahve tozu, Suda çözünür kahve tozu, Hazır kahve tozu @@ -9068,6 +9073,7 @@ ciqual_food_name:fr:Café, poudre soluble en:Coffee without sugar bg:Кафе без захар fr:Café non sucré +pl:Kawa bez cukru pt:Café sem açúcar agribalyse_food_code:en:18004 ciqual_food_code:en:18004 @@ -9201,6 +9207,7 @@ fr:Cappuccino en poudre, Cappuccino en poudre soluble hr:Cappuccino u prahu, Cappuccino prah it:Cappuccino in polvere lt:Kapučino milteliai, greitai paruošiamas kapučino +pl:Cappucino w proszku nl:Cappucinopoeders, Cappucinopoeder agribalyse_food_code:en:18160 ciqual_food_code:en:18160 @@ -9217,6 +9224,7 @@ nl:Gearomatiseerde oploskoffies, Gearomatiseerde instantkoffies en:Freeze-dried instant coffees de:Gefriergetrocknete Instant-Kaffees nl:Gevriesdroogde oploskoffies, Gevriesdroogde oploskoffie +pl:Kawa liofilizowana ru:Кофе растворимый сублимированный, Растворимый сублимированный кофе, Кофе сублимированный растворимый, Сублимированный растворимый кофе, Кофе натуральный растворимый сублимированный, Натуральный растворимый сублимированный кофе Date: Tue, 9 Jan 2024 11:24:31 +0100 Subject: [PATCH 2/4] taxonomy: add/fix polish ingredients --- lib/ProductOpener/Ingredients.pm | 1 + taxonomies/additives.txt | 2 +- taxonomies/additives_classes.txt | 5 +++- taxonomies/ingredients.txt | 51 +++++++++++++++++++++++++------- 4 files changed, 46 insertions(+), 13 deletions(-) diff --git a/lib/ProductOpener/Ingredients.pm b/lib/ProductOpener/Ingredients.pm index 7470ffa2353de..6b9c4fed8851d 100644 --- a/lib/ProductOpener/Ingredients.pm +++ b/lib/ProductOpener/Ingredients.pm @@ -763,6 +763,7 @@ my %min_regexp = ( en => "min|min\.|minimum", es => "min|min\.|mín|mín\.|mínimo|minimo|minimum", fr => "min|min\.|mini|minimum", + pl => "min|min\.|minimum", ); # Words that can be ignored after a percent diff --git a/taxonomies/additives.txt b/taxonomies/additives.txt index 643cecea7545f..33594029338f3 100644 --- a/taxonomies/additives.txt +++ b/taxonomies/additives.txt @@ -8362,7 +8362,7 @@ lt:E333, E333 food additive lv:E333, E333 food additive mt:E333, E333 food additive nl:E333, Calciumcitraten -pl:E333, Cytryniany wapnia +pl:E333, Cytryniany wapnia, cytrynian wapnia pt:E333, Citrato de cálcio ro:E333, E333 food additive ru:E333, Цитрат кальция diff --git a/taxonomies/additives_classes.txt b/taxonomies/additives_classes.txt index 8a2b5144052b1..3b08e5bb777d3 100644 --- a/taxonomies/additives_classes.txt +++ b/taxonomies/additives_classes.txt @@ -406,6 +406,7 @@ description:sv:Färgämnen: ämnen som tillför eller återställer färg hos li en:concentrated plant colour de:färbendes Pflanzenkonzentrat, färbende Pflanzenkonzentrate es:colorante vegetal concentrado +pl:koncentraty barwiące, koncentrat barwiący, wyciągi barwiące, barwiące koncentraty Date: Tue, 9 Jan 2024 11:30:36 +0100 Subject: [PATCH 3/4] Remove unnecessary :? --- lib/ProductOpener/Ingredients.pm | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/lib/ProductOpener/Ingredients.pm b/lib/ProductOpener/Ingredients.pm index 6b9c4fed8851d..d6461382bd616 100644 --- a/lib/ProductOpener/Ingredients.pm +++ b/lib/ProductOpener/Ingredients.pm @@ -200,7 +200,7 @@ my %may_contain_regexps = ( "Dit product kan sporen van|bevat mogelijk sporen van|Kan sporen bevatten van|Kan sporen van|bevat mogelijk|sporen van", nb => "kan inneholde spor av|kan forekomme spor av|kan inneholde spor|kan forekomme spor|kan inneholde|kan forekomme", - pl => "może zawierać śladowe ilości|produkt może zawierać:?|może zawierać:?|możliwa obecność", + pl => "może zawierać śladowe ilości|produkt może zawierać|może zawierać|możliwa obecność", pt => "pode conter vestígios de|pode conter", ro => "poate con[țţt]ine urme de|poate con[țţt]ine|poate con[țţt]in", ru => "Могут содержаться следы", From 3f892158615286067f4448605574241eb752d705 Mon Sep 17 00:00:00 2001 From: Alex Garel Date: Mon, 22 Jan 2024 16:25:17 +0100 Subject: [PATCH 4/4] =?UTF-8?q?chore:=C2=A0update=20tests=20results?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../ingredients_percent/percentage-range-negative-pl.json | 5 ++--- 1 file changed, 2 insertions(+), 3 deletions(-) diff --git a/tests/unit/expected_test_results/ingredients_percent/percentage-range-negative-pl.json b/tests/unit/expected_test_results/ingredients_percent/percentage-range-negative-pl.json index b00c3ae82bd01..fdcea19ad8b6f 100644 --- a/tests/unit/expected_test_results/ingredients_percent/percentage-range-negative-pl.json +++ b/tests/unit/expected_test_results/ingredients_percent/percentage-range-negative-pl.json @@ -8,13 +8,12 @@ "text" : "jabłka" }, { - "id" : "en:mango", + "id" : "en:mango-puree", "percent" : 10, "percent_estimate" : 10, "percent_max" : 10, "percent_min" : 10, - "processing" : "en:pureed", - "text" : "mango" + "text" : "przecier z mango" }, { "id" : "en:concentrated-apple-juice",