Specification gaming examples in AI [en]

docs.google.com

Das hier ist sehr schräg und sehr nerdig. In diesem GoogleDoc wird unerwartetes Verhalten von Künstlichen Intelligenzen gelistet, die, soweit ich es richtig verstehe, für Computerspiele trainiert werden. Manchmal gibt es YouTube-Links dazu.

Erkennen können Expert*innen dabei: KI erreichen die gesetzten Ziele auch durch komplett amoralisches Verhalten (logisch, sie kennen ja keine Moral), sie finden Umwege, Abkürzungen und Hacks, die teilweise regelrecht brutal wären, wenn es ums echte Leben ginge. Und das wiederum bedeutet, dass unfertige KI die Welt zerstören könnten.

Es bedeutet aber u.U. auch, dass sie das schon lange tun, wenn sie bspw. in Finanzmärkten eingesetzt werden. Hier gibt es noch einen Artikel dazu.

Wie gesagt: Extrem nerdig. Aber spannend. (via)

Mehr lesen...
Linkedin

Möchtest Du weitere ähnliche Newsletter erhalten?