Разработчики взвешивают плюсы и минусы интерпретатора кода ChatGPT и ждут обновлений

Хотя исследователи из Университета Западной Вирджинии видят потенциал в образовательных учреждениях новейшего официального плагина ChatGPT под названием Code Interpreter, они обнаружили ограничения для его использования учеными, которые работают с биологическими данными, используя вычислительные методы для определения приоритетности целевого лечения рака и генетических заболеваний.

«Интерпретатор кода — хорошая вещь, и он полезен в образовательной среде, поскольку делает программирование в областях STEM более доступным для студентов», — сказал Ганцин «Майкл» Ху, доцент кафедры микробиологии, иммунологии и клеточной биологии WVU. Медицинский факультет и директор Центра биоинформатики.

«Однако у него нет функций, необходимых для биоинформатики. Это технические проблемы, которые можно преодолеть. Будущие разработки Code Interpreter, вероятно, расширят его использование во многих областях, таких как биоинформатика, финансы и экономика».

С момента своего выпуска в декабре 2022 года популярный чат-бот ChatGPT с искусственным интеллектом привлек внимание бизнеса, преподавателей и широкой общественности. Однако он не совсем соответствовал потребностям людей, работающих в биомедицинских исследованиях, включая биоинформатику (область, где информатика встречается с биологией), которые с нетерпением ждали плагина OpenAI Code Interpreter, надеясь, что он заполнит пробелы.

Ху и его команда протестировали Code Interpreter на различных задачах, чтобы оценить его возможности. Их результаты, опубликованные в Annals of Biomedical Engineering , показывают, что плагин преодолевает некоторые барьеры, но не все.

Например, люди без научного образования смогут легко получить доступ к кодированию или компьютерному программированию с помощью Code Interpreter. Ху сказал, что это также экономически эффективно и вызывает у студентов интерес к изучению анализа данных, а также повышает их интерес к обучению. Однако он отмечает, что пользователям необходимо будет понимать, как интерпретировать данные, понимать, точны ли результаты, и знать, как взаимодействовать с чат-ботом.

Биоинформатики полагаются на точное кодирование, компьютерные программы и доступ к Интернету для хранения, анализа и интерпретации биологических данных, таких как ДНК и геном человека , которые используются для достижений современной медицины.

Несмотря на необходимость усовершенствований, характерных для биоинформатики, сказал Ху, Code Interpreter помогает пользователям определить, является ли ответ точным или это фиктивный ответ, представленный с уверенностью, известный как галлюцинация.

«Люди знают, что ChatGPT может делать много впечатляющих вещей, но он не очень хорош в предоставлении цитат или ссылок в поддержку своего ответа. Если его спросят об источнике, подтверждающем утверждение ответа, он может начать придумывать ссылки, «Пояснил Ху. «Code Interpreter обеспечивает решение, позволяющее свести к минимуму галлюцинации. Для вопросов, которые можно решить с помощью кодирования, сам код служит источником или цитатой. Это значительный шаг вперед».

С Ху работали Лэй Ван, научный сотрудник кафедры микробиологии, иммунологии и клеточной биологии WVU; Сиджин Ге из Университета штата Южная Дакота; и Ли Лю из Университета штата Аризона.

Команда обнаружила положительные результаты в способности Code Interpreter преобразовывать данные в диаграммы и графики.

Предложения по обновлению Code Interpreter включают доступ в Интернет для загрузки данных генома, установку программного обеспечения, специфичного для биоинформатики, расширение емкости хранилища и поддержку дополнительных языков программирования. Кроме того, исследователи обнаружили, что приложения для обеспечения конфиденциальности и безопасности должны соответствовать таким нормам, как HIPAA.

При тестировании анализа данных они обнаружили несколько ограничений. Плагин поддерживает только одну компьютерную программу — Python, и лишь немногие из его программных пакетов посвящены биоинформатике. Кроме того, он не обеспечивает доступ к интернет-данным и не имеет возможности работать с большими файлами.

«Он позволяет использовать 100 мегабайт или около того, но файлы, с которыми мы работаем, имеют размер гигабайта», — сказал Ху. «Кроме того, он не поддерживает параллельную обработку, необходимую для больших наборов данных, что приводит к снижению производительности».

Ху сказал, что, хотя он ожидает новых обновлений Code Interpreter, он планирует помочь студентам узнать больше о преимуществах текущего плагина.

«В моем классе следующей весной я планирую представить этот плагин, чтобы помочь студентам научиться визуализации данных», — сказал Ху. «ИИ — это быстро развивающаяся область. Я надеюсь, что к тому времени OpenAI сможет преодолеть некоторые ограничения и его можно будет использовать для широкого спектра биоинформатического кодирования».

Ранее в этом году Ху провел еще одно исследование , чтобы подготовить старшеклассников и студентов к использованию возможностей ChatGPT, узнавая больше о кодировании. В процессе использовался OPTIMAL — оптимизация подсказок посредством итеративного наставничества и оценки — для улучшения общения с чат-ботом.

В долгосрочной перспективе Ху сказал, что продолжит отслеживать и тестировать новые программы и функции искусственного интеллекта.

«По мере разработки новых продуктов я буду продолжать работать», — сказал Ху. «Конечно, есть много других инновационных применений, которые ждут своего открытия».