TIME: ШІ вучыцца, як дзіця
2- 25.01.2026, 16:41
- 1,124
Адных толькі правілаў недастаткова.
Кампанія Anthropic апублікавала абноўленае кіраўніцтва для свайго ШІ Claude — дакумент, які выкарыстоўваецца для фармавання паводзінаў і каштоўнасцяў мадэлі. У кампаніі параўноўваюць працэс навучання ШІ не з матэматычнай аптымізацыяй, а з выхаваннем дзіцяці, — піша часопіс TIME (пераклад — сайт Charter97.org).
Паводле слоў філосафа Аманды Аскел, якая адказвае за «характар» Claude, сучасныя ШІ сталі настолькі разумнымі, што ім важна не проста задаваць правілы, а тлумачыць прычыны гэтых правілаў. Новы дакумент, адрасаваны самому ШІ, апісвае, чаму Claude павінен дзейнічаць этычна, бяспечна і ў інтарэсах карыстальніка — і менавіта ў такім парадку.
Кіраўніцтва выкарыстоўваецца на розных этапах навучання і прызначана дапамагчы мадэлі лепш арыентавацца ў нестандартных сітуацыях. У прыватнасці, Claude заахвочваецца «пярэчыць» карыстальніку, калі запыт супярэчыць базавым этычным прынцыпам, нават калі ён зыходзіць ад самой Anthropic. У дакуменце наўпрост гаворыцца, што ШІ павінен адмаўляцца садзейнічаць таму, што вядзе да незаконнай канцэнтрацыі ўлады або парушэння правоў.
Anthropic спадзяецца, што публікацыя кіраўніцтва падштурхне і іншыя кампаніі да аналагічнага падыходу. Эксперты адзначаюць, што пераход ад абстрактных матэматычных «функцый узнагароды» да тэкставых прынцыпаў стаў магчымы дзякуючы развіццю вялікіх моўных мадэляў, якія працуюць з натуральнай мовай.
Пры гэтым у кампаніі прызнаюць, што кіраўніцтва не вырашае цалкам праблему ўзгаднення ШІ з чалавечымі каштоўнасцямі. Дакумент прымяняецца да публічных версій Claude і не абавязкова выкарыстоўваецца ў спецыялізаваных мадэлях, напрыклад для дзяржаўных заказчыкаў.