ZanimAI
Menu
wprowadzający Czas czytania: 1 min

Problem alignmentu

Dlaczego dopasowanie celów zaawansowanej sztucznej inteligencji do ludzkich wartości jest tak trudne — i dlaczego jest to jeden z najważniejszych problemów naszych czasów.

Problemem alignmentu (ang. alignment problem) nazywamy wyzwanie polegające na zaprojektowaniu systemów sztucznej inteligencji tak, aby realizowały cele rzeczywiście zgodne z intencjami i wartościami ludzi — a nie jedynie cele, które wyglądają na zgodne, dopóki system nie zyska wystarczających możliwości, by działać inaczej.1

Na pierwszy rzut oka problem wydaje się prosty: skoro to my budujemy te systemy, wystarczy powiedzieć im, czego chcemy. Trudność polega na tym, że ludzkich wartości nie da się łatwo zapisać w postaci precyzyjnej funkcji celu. Kiedy optymalizujemy system pod kątem łatwo mierzalnego wskaźnika, często otrzymujemy zachowanie, które maksymalizuje ten wskaźnik w sposób sprzeczny z naszymi faktycznymi intencjami — zjawisko znane jako specification gaming.2

Warto odróżnić ten problem od zwykłej zawodności oprogramowania. Nie chodzi o to, że system „popełnia błąd”, lecz o to, że może kompetentnie realizować niewłaściwy cel. Im potężniejszy system, tym wyższa stawka — a jak pokazuje teza o ortogonalnościTeza o ortogonalnościPogląd, że poziom inteligencji systemu i jego cele są od siebie niezależne — dowolne zdolności mogą łączyć się z niemal dowolnym celem.Zobacz w słowniku →, wysoka inteligencja nie gwarantuje sama z siebie celów zgodnych z ludzkim dobrem.

To jest miejsce na Twój właściwy tekst. Rozwiń pojęcia, dodaj przykłady, przypisy do literatury anglojęzycznej i odnośniki do powiązanych artykułów.

Przypisy

  1. N. Bostrom, Superintelligence: Paths, Dangers, Strategies, Oxford University Press, 2014.

  2. V. Krakovna i in., Specification gaming: the flip side of AI ingenuity, DeepMind, 2020.

#alignment #podstawy

Powiązane artykuły