Umělá inteligence může odborným nakladatelstvím pomoci. Musíme ale tlačit na její otevřenost a kvalitu

Name: Umělá inteligence může pomoci odborným nakladatelstvím.
Uploaded: 2021-04-16T00:00:00.000Z
Description: V zájmu vědecké komunity i veřejnosti je, aby velké jazykové modely jako GPT fungovaly transparentně a spolehlivě.

Pá, 3.11.2023

| Originální článek z: Universitas/Martina Dvořáková

V zájmu vědecké komunity i veřejnosti je, aby velké jazykové modely jako GPT fungovaly transparentně a spolehlivě.

Foto: Universitas/archiv AEUP: Umělá inteligence může odborným nakladatelstvím pomoci. Musíme ale tlačit na její otevřenost a kvalitu
Video: Brain We Are: Tomáš Mikolov - Umělá Inteligence a Výzkum

V odborném publikování pak mohou ušetřit mnoho rutinní práce – a přinést renesanci vědecké komunikace.

Na letošní konferenci Asociace evropských univerzitních nakladatelů (AEUP) konané v estonských městech Tallin a Tartu se hodně mluvilo o důsledcích vzestupu umělé inteligence na vydávání odborných knih a časopisů. Důvod je zřejmý: popularita služby ChatGPT a její konkurence jako Bard či Claude.

Universitas: Asociace evropských univerzitních nakladatelů věnovala estonskou konferenci příležitostem i hrozbám třesku AI

Současné pokročilé jazykové modely se dokázaly celkem dobře naučit syntaxi a sémantiku lidského jazyka. Konverzace s nimi často působí jako rozhovor se skutečným člověkem a jejich výstupy jsou mnohdy k nerozeznání od textů psaných lidmi.

AEUP

Asociace evropských univerzitních nakladatelství (AEUP) pomáhá svým členům navazovat a prohlubovat vzájemné vztahy, spolupracovat a sdílet znalosti v zájmu sdílených cílů a společně řešit strategické i každodenní záležitosti. Byla založena v roce 2010, nyní má 48 členů z 18 evropských zemí. Každé dva roky pořádá mezinárodní konferenci zaměřenou na aktuální téma z oblasti odborného publikování.

Pro svět publikování a vědy i pro jejich průnik to má vážné důsledky. Chceme přece vědět, jestli vědeckou publikaci vydanou renomovaným odborným nakladatelstvím napsal člověk, nebo robot. Na druhou stranu s umělou inteligencí běžně pracujeme už teď a nebojíme se toho – využívají ji nástroje na automatické opravy textu, kontrolu pravopisu či automatický překlad. V redakcích se běžně používá software usnadňující různé fáze redakčního procesu, tvorbu anotací nebo rejstříků. Někde se pouštějí ještě dál a nechávají umělou inteligenci pomáhat s posudky na odborné články.

Všechno výše uvedené dlouho dělali lidé, a pokroky v rozvoji AI proto zcela pochopitelně vzbuzují obavy, že mnoho z nich ztratí práci. Je to velmi pravděpodobné: podle jedné studie umělá inteligence do roku 2030 celosvětově nahradí 15 procent zaměstnanců a zaměstnankyň, tedy až 400 milionů lidí.

Tyto lidi o práci nicméně nepřipraví samotná umělá inteligence, ale spíše jiní lidé, kteří se ji naučí dobře využívat. AI totiž nepracuje sama, i když to tak na první pohled vypadá. Pouze reaguje na napsané zadání, takzvaný prompt. Čím lepší prompt, tím lepší výsledek. A abyste dokázali dobře promptovat (ano, čeština už toto slovo používá), neobejdete se bez hlubokých znalostí oblasti, v níž se pohybujete.

Velmi dobře to ukazuje spisovatel Stephen Marche, který se pomocí umělé inteligence pokusil napsat detektivní novelu: „Vím, jak má vypadat dobrý text. Vím, koho by měla Sudowrite (použitý AI nástroj, pozn. red.) napodobovat, a dokážu vysvětlit proč. Vím, jak má vypadat vybroušená věta a odstavec dovedený k dokonalosti. Literární tvorbě nestačí rozumět méně, musíte ji naopak rozumět lépe.“

Můžeme si tedy dovolit předpokládat, že kdyby měla AI psát odborné články, stále by to od lidí vyžadovalo velmi dobrou znalost konkrétní problematiky a navíc velmi dobré prompty.

Není však pochyb o tom, že jde o zcela zásadní proměnu celého prostředí. Jak na jarní konferenci AEUP uvedl přední odborník na otevřenou vědu a vizionář Pierre Mounier, prožíváme největší revoluci v odvětví od Gutenbergova vynálezu knihtisku.

Roboti útočí. Cíl: odborné publikování

Účastníci a účastnice zmíněné konference nevěnovali příliš pozornosti obavám, že přijdou o práci. Trápily je spíše jiné věci: budoucnost autorství a copyrightu nebo problém nadbytku textů nepřinášejících nic nového a s tím související potenciální kolaps systému recenzních posudků. Ten je ostatně v krizi už teď.

AI nicméně pracovní trh promění – a to i v oblasti odborného publikování. Sarah Moorhouse, redaktorka SAGE Publishing, ve svém článku pro The Bookseller zmiňuje roli odborných asistentů, kteří se často podílejí na odborných publikacích svých školitelů: „Když výzkumníci spolupracují s asistenty, dochází ke vzájemné produktivní výměně myšlenek mezi odborníky na různých úrovních univerzitní hierarchie. Jestliže jim ale první verzi článku vytvoří ChatGPT, akademický ekosystém, jehož je publikovaný článek jen nepatrnou součástí, se tím v mnohém ochudí.“

Dalším a možná ještě palčivějším problémem je hodnocení vědeckých publikací, tedy peer-review. O pozornost recenzentů soupeří obrovské množství rukopisů, což vydání článků výrazně zpomaluje. Recenzenti tuto práci navíc většinou dělají bezúplatně. Nelze se divit, že při zvážení všech ostatních povinností akademických pracovníků jejich motivace psát recenze klesá. Už dlouho se mluví o tom, že je takový systém neudržitelný, ačkoli se počty článků zatím neustále zvyšují.

Na vině není jen nastavení systému podle hesla „publish or perish“, ale částečně také automatizace. Je možné, že až čtvrtina rukopisů zaslaných v některých oborech k recenznímu řízení je dílem takzvaných paper mills, tedy společností, které za úplatu produkují plagiáty či zcela smyšlené rukopisy. Ty teď dostaly k ruce nástroje, které takový „vědecký“ článek vygenerují za pár sekund. „Vzhledem k tomu, jak lehkovážně ChatGPT přistupuje k faktům, celý peer-review systém se může brzy ocitnout na velmi tenkém ledě,“ předpovídá Sarah Moorhouse.

Kromě kolapsu systému peer-review představuje tato situace ještě další problém: „Jak budou vědci moci vycházet z dříve publikovaných výsledků, pokud bude celý systém akademického publikování kontaminován tisíci věrohodně působících, ale falešných článků? Jak můžeme trénovat potenciálně užitečné AI výzkumné asistenty, aby čerpali nové poznatky z vědeckých prací, když budou do velké míry nesmyslné?“ ptá se Tim Vines z odborného webu The Scholarly Kitchen.

Dále tu máme zmíněný problém s autorstvím a citacemi. Z čeho se vlastně umělá inteligence učí? Kdo je autorem textu, který napsala AI? Jak citovat použité zdroje?

„Je to také otázka plagiátorství. ChatGPT neuvádí, z čeho čerpá, když reaguje na vaše prompty. Používá věty někoho jiného? Parafrázuje něčí myšlenky? Tohle všechno musíme mít na paměti,“ upozorňuje šéfredaktor technologického webu Gizmodo David Ewalt.

A navíc: AI je natrénovaná na existujících textech, z nichž mnohé jsou plné nejen zavádějících a nepravdivých informací, ale také předsudků a nenávisti. Existují sice omezení, která umělé inteligenci brání produkovat nenávistné texty, ale není nijak těžké je obejít.

Stávající systém odborného publikování závisí mimo jiné na důvěře a osobní integritě. Jenže velké jazykové modely není technicky možné naprogramovat tak, aby psaly pravdu. Pracují tak, aby byli čtenáři s jejich výsledky spokojení, což je něco zcela jiného a přímo to odporuje akademickým zásadám. Namísto pronikavých a zásadních vědeckých poznatků budeme možná brzy čelit nekonečnému množství zcela banálních článků beze stopy invence či kreativity. Když si nedáme pozor, můžeme se snadno ocitnout ve světě „s tolika falešnými texty a obrazy, že už nikdo nedokáže rozlišit, co je vlastně pravda“.

Esejista Nassim Nicholas Taleb ve svém bonmotu nabízí poněkud zjednodušený pohled na AI jako na „stroj papouškující klišé“ a v komentářích se nevyhnul rozhořčené kritice uživatelů ChatGPT. Faktem ale je, že přijít s něčím novým, co „tady ještě nebylo“, je teď těžké už i pro lidi samotné.

Opačný pohled na perspektivy umělé inteligence nabízí článek britského spisovatele Stephena Marcheho The Future of Writing Is a Lot Like Hip-Hop.

Umělá inteligence může přinést únik z šablonovitosti právě tím, že funguje otevřeně derivativně. Není to nic jiného. DJ Kool Herc, první hiphopový DJ, si 11. srpna 1973 přinesl v Bronxu na sestřinu párty u příležitosti zahájení semestru dva gramofony a mikrofon, jaké vídával na diskotékách v centru města. Na nich pak izoloval a následně opakoval funkové beaty a v jistém smyslu provedl vrcholně derivativní věc: v podstatě jen opakoval dobrý motiv z úspěšné nahrávky pořád dokola. Zároveň ale udělal i něco vrcholně originálního: vymyslel break. Hip-hop se tím rozrostl o zcela nový žánr, nový styl, nový přístup k životu. Trvalo asi dvacet let, než lidé uznali, že hip-hop je umění, ale když k tomu došlo, ukázalo se, že jde o nejvýznamnější umění své doby. Kultura často funguje neintuitivně. Umělá inteligence může být lanem, které nás vytáhne z propasti neustálého opakování již řečeného.

Marcheho text hezky ukazuje, že AI skutečně může nabídnout i nové příležitosti. Hodně už bylo řečeno například o tom, že je nutné změnit současný systém hodnocení vědy, který nutí vědce publikovat stále nové a nové texty. Možná je právě rozmach AI, která to možná brzy dokáže mnohem lépe (a zcela určitě rychleji) než oni, impulsem k reálné změně. A to není všechno.

Cesta z pasti

Je snadné vysypat z rukávu výhody, které nám umělá inteligence může přinést, nebo dokonce už přináší, především z hlediska efektivity a produktivity práce. Editorům a literárním agentům pomáhá rychleji zpracovat přijaté náměty. Rozvíjejí se možnosti digitálních osobních asistentů. Slibná budoucnost čeká analýzu dat: „Nakladatelé mohou využít umělou inteligenci k analýze údajů o čtenářích a rozpoznávání trendů, což jim pomůže lépe rozhodovat o tom, jaké knihy vydávat, jak je uvádět na trh a jak je nacenit,“ říká Red Hilton z Belmont City Press.

Přímo před očima se zlepšují nástroje automatického překladu. Sarah Elaine Eaton z Committee on Publication Ethics zaujala na konferenci AEUP účastníky svým odhadem, že už brzy bude možné, aby každý mluvil svojí řečí a ostatní ho poslouchali ve svých preferovaných jazycích. Funkční automatické simultánní tlumočení máme na dosah a brzy si budete také moci vybrat z desítek různých jazykových verzí každé odborné publikace.

Budoucnost možná nakonec nespočívá v několika málo všeobecných velkých jazykových modelech, o kterých se dnes nejvíc mluví, ale spíše v menších a specializovaných řešeních. Je pravděpodobné, že vzniknou odborné jazykové modely trénované na ověřených (a otevřených!) datech, jejichž výstupy budou důvěryhodnější. Společnost Clarivate, provozovatel citační databáze Web of Science, nedávno oznámila spolupráci s týmem AI21 Labs. Jejich cílem je integrovat velké jazykové modely do svých nástrojů a nabídnout tak odborníkům intuitivní vyhledávání a rešerše pomocí konverzační AI speciálně navržené tak, aby „pomáhala výzkumníkům i studentům dosáhnout úspěchu a zároveň zůstala v souladu se základními vědeckými zásadami a hodnotami.“

Aby nám mohla umělá inteligence dobře sloužit, je především nutné nastavit jejímu použití správná pravidla. A to nebude jednoduché. Například Itálie nejprve ChatGPT zcela zakázala, ale brzy se ukázalo, že to nebude ta správná cesta. To stejné platí i v případě používání AI na školách a univerzitách. Žádná všeobecně platná pravidla použití zatím neexistují, ale na některých principech se shodují téměř všichni. Především, že nelze uvádět AI jako spoluautora (takové publikace nepřijímají mimo jiné v Cambridge University Press či Springer Nature). Můžete ji však využít pro první draft textu, který potom dále rozpracujete, a hlavně za něj převezmete autorskou odpovědnost.

...

Celý článek naleznete na webu časopisu Universitas.

Universitas

Umělá inteligence může odborným nakladatelstvím pomoci. Musíme ale tlačit na její otevřenost a kvalitu

Roboti útočí. Cíl: odborné publikování

Cesta z pasti

Mohlo by Vás zajímat

Quantifying Contamination in Mass Spectrometers Using SEM-EDX

Waters Aura Systems

VITATOX: LC/GC/MS v toxikologické analýze: aplikační trendy a digitální ekosystém LabRulez

The Agilent 9500 ICP-MS

Agilent 9500 ICP‑QQQ with m‑Lens for Ultratrace Analysis of High‑Purity Reagents

Podobné články

Má generativní AI a ChatGPT ve vědě své místo?

Dokáže umělá inteligence napsat vědecký článek?

AI demokratizuje přístup k informacím. Může přinést vědeckou revoluci

Bojar: ChatGPT funguje jako agregátor internetového dojmu

Mohlo by Vás zajímat

Quantifying Contamination in Mass Spectrometers Using SEM-EDX

Waters Aura Systems

VITATOX: LC/GC/MS v toxikologické analýze: aplikační trendy a digitální ekosystém LabRulez

The Agilent 9500 ICP-MS

Agilent 9500 ICP‑QQQ with m‑Lens for Ultratrace Analysis of High‑Purity Reagents

Podobné články

Má generativní AI a ChatGPT ve vědě své místo?

Dokáže umělá inteligence napsat vědecký článek?

AI demokratizuje přístup k informacím. Může přinést vědeckou revoluci

Bojar: ChatGPT funguje jako agregátor internetového dojmu

Mohlo by Vás zajímat

Quantifying Contamination in Mass Spectrometers Using SEM-EDX

Waters Aura Systems

VITATOX: LC/GC/MS v toxikologické analýze: aplikační trendy a digitální ekosystém LabRulez

The Agilent 9500 ICP-MS

Agilent 9500 ICP‑QQQ with m‑Lens for Ultratrace Analysis of High‑Purity Reagents

Podobné články

Má generativní AI a ChatGPT ve vědě své místo?

Dokáže umělá inteligence napsat vědecký článek?

AI demokratizuje přístup k informacím. Může přinést vědeckou revoluci

Bojar: ChatGPT funguje jako agregátor internetového dojmu

Mohlo by Vás zajímat

Quantifying Contamination in Mass Spectrometers Using SEM-EDX

Waters Aura Systems

VITATOX: LC/GC/MS v toxikologické analýze: aplikační trendy a digitální ekosystém LabRulez

The Agilent 9500 ICP-MS

Agilent 9500 ICP‑QQQ with m‑Lens for Ultratrace Analysis of High‑Purity Reagents

Podobné články

Má generativní AI a ChatGPT ve vědě své místo?

Dokáže umělá inteligence napsat vědecký článek?

AI demokratizuje přístup k informacím. Může přinést vědeckou revoluci

Bojar: ChatGPT funguje jako agregátor internetového dojmu