Dokáže AI vyřešit jednu z nejstarších záhad lingvistiky?

Dokáže AI vyřešit jednu z nejstarších záhad lingvistiky? Komplikuje to samozřejmě hlavně to, že překladatelská AI jsou založena na zásadně velké zásobě materiálu, zejména takového co umožní srovnávat varianty ve dvou jazycích. Tzv. paralelní korpus pak umožní překlad mezi dvěma jazyky a pro ty kde není dostatečná zásoba se využívá překlad skrz jiný jazyk. Samozřejmě nejčastěji angličtinu. V Can A.I. solve one of the oldest mysteries of linguistics? najdete zajímavé čtení o snaze přeložit jazyk označovaný jako Linear A.

OpenAI se chystá komerčně zpřístupnit pomůcku, kterou původně označovali za nebezpečnou.

OpenAI se chystá komerčně zpřístupnit pomůcku, kterou původně označovali za nebezpečnou. Řeč je samozřejmě o „generátoru fake textů“ známém jako GPT (aktuálně v podobě GPT-3). Zpřístupnění bude ve formě API, které umožní AI využívat firmám. Via Elon Musk-backed OpenAI to release text tool it called dangerous a zajímavé čtení najdete i v OpenAI’s gigantic GPT-3 hints at the limits of language models for AI

2020-06-12 21_41_35-OpenAI API

Hello Emma! co umí na iPhone hlasové ovládání česky.

Najdete na helloemma.cz a je to hezké a autor je šikovný a vypadá to na hodně práce, jen to má vadu, že je to celé nutné dost složitě zprovoznit. Je to naroubované přes Zkratky, které musíte jednotlivě stáhnout a instalovat. Čímž je dáno i to, že může reagovat jenom na předem známé a poměrně úzce definované věci. Celé je to přitom trochu absurdní, na iPhone je možné diktovat česky, takže Apple rozpoznávat češtinu umí. Jen na Siri ji nějak ne a ne nastavit.

Oxfordský slovník angličtiny nově obsahuje „fake news“.

Oxfordský slovník angličtiny nově obsahuje „fake news“. Slovo populární posledních několik let má ale původ až někdy v roce 1980. V oznámení o novém přídavku je řeč i o zvyšující se míře využít dalších souvisejících slov jako „fakeable“, „fakement“ a „fakeness“.  Kompletní přehled říjnových novinek v New words list October 2019

fake news: news that conveys or incorporates false, fabricated, or deliberately misleading information, or that is characterized as or accused of doing so.

Co se stalo s Urban Dictionary?

Co se stalo s Urban Dictionary je skvělé čtení o samotném základu Internetu, který se v průběhu let mění, stejně jako se měnil obsah na Urban Dictionary. Jako všude je tahle (ještě stále) extrémně užitečná služba zaplavována nenávistí, xenofobií a rasismem. Ke škodě věci je, že provozovatel to neřeší a ani řešit nechce (a dost dobře možná má pravdu v tom, že je to neřešitelné).

2019-09-15 08_14_36-Urban Dictionary, September 14_ has me dead.png

Wikipedia má problém. Google Translate se nedá využít pro méně rozšířené jazyky

Wikipedia má problém. Google Translate se nedá využít pro méně rozšířené jazyky a přitom by se to velmi hodilo pro další rozšíření obsahu. 5.5 milionu článků v angličtině by přeložením výrazně obohatilo některé z dalších 300 jazykových mutací Wikipedii. Od ledna 2019 se Google stal partnerem s WikiMedia a Google Translate se tak dostalo mezi pomůcky strojového překladu. Což nakonec vedlo k tomu, co známe i při překladech z/do češtiny. Výsledky jsou mnohdy katastrofa. Odehrávají se tam i takové lahůdky jako překlad „village pump“ z angličtiny do portugalštiny jako „bombardujte vesnici“. Viz Wikipedia has a Google Translate problem

2015-08-13 10_57_09-Wikipedia

Facebook odstranil překlady Barmštiny po upozornění, že to vytváří bizarní věci.

Facebook odstranil překlady Barmštiny po upozornění, že to vytváří bizarní věci. Možná by mohl Facebook pokračovat i s dalšími jazyka, protože i tam se najdou neméně bizarní výsledky. Viz Facebook removes Burmese translation feature after Reuters report a konkrétní k problému překladu viz Why Facebook is losing the war on hate speech in Myanmar. U čehož je potřeba si uvědomit, že cenzoři Facebooku používají právě strojový překlad k tomu, aby posuzovali obsah.

graphic-myanmar-facebook-hate-speech.png