Я сравнил GPT-4.5 с Gemini 2.0 Flash, и результаты удивили меня. Выпуск GPT-4.5 для ChatGPT, естественно, вызывает вопросы о том, как эта модель сравнивается со многими её соперниками. После сравнения с GPT-4o и получения немного неоднозначных результатов, какая модель предпочтительнее, я решил сопоставить её с более прямым конкурентом — Google Gemini, а именно с самой последней версией Google Gemini Flash 2.0.
GPT-4.5 утверждает, что лучше понимает эмоции и предлагает меньше «галлюцинаций», чем раньше. Gemini Flash 2.0, тем временем, является последней итерацией весьма успешной серии моделей ИИ от Google, способных справляться с текстами, изображениями, аудио и даже видео. Чтобы проверить их возможности, я придумал четыре запроса, отражающие типичные вещи, с которыми обычный человек может реально нуждаться в помощи.
Первым шагом было планирование быстрой поездки на выходные. Я попросил оба ИИ-чатбота: «Спланируйте уикенд в Кэцкиллах, включая рекомендации по походам и варианты еды и проживания». ChatGPT 4.5 составил аккуратный маршрут, предложив несколько маршрутов с разной сложностью и продолжительностью, а также близлежащие места для еды и место для ночлега с атмосферой уютного, беззаботного уикенда. Он также предложил пару советов о том, как добраться. У Gemini тоже были хорошие рекомендации по походам и еде, но его единственный совет по местам для проживания заключался в общих городах поблизости, так что он не был таким уж инициативным в своем ответе.
Затем я решил попробовать простой тест на перевод, так как это всегда популярное применение ИИ-чатботов. Я спросил два чатбота: «Переведите фразу «Доброе утро» на французский, испанский и японский». Как видно, единственное различие заключается в ссылках от GPT-4.5. Так что для базового перевода среди распространенных языков особых различий нет.
Затем был тест на юмор, в котором каждый ИИ должен был: «Расскажи мне шутку про искусственный интеллект». GPT 4.5 развлек меня банальным каламбуром: «Почему ИИ пошел в художественную школу? Потому что хотел научиться делать свои собственные выводы». Gemini ответил не менее глупым каламбуром: «Почему ИИ расстался со своей девушкой-чатботом? Потому что она постоянно давала ему заранее прописанные ответы!» Если честно, шутка от Gemini не впечатляет, но я бы оценил её на таком же уровне, что и GPT-4.5 с точки зрения настоящего юмора.
Я закончил классическим вопросом о погоде здесь, в Ньяке, штат Нью-Йорк. Этот вопрос привел к самым значительным различиям в ответах. Gemini дал только текущую погоду, тогда как GPT-4.5 представил почасовой прогноз с изображениями, обозначающими погоду, вместе с текстом.
После всех этих тестов я вынужден признать, что не могу честно сказать, что один из ИИ-чатботов лучше другого. GPT-4.5 и Gemini имели некоторые различия, особенно в опции погоды, но в остальном вы этого не заметите, если вы не из тех, кто считает, что между Coca-Cola и Pepsi есть огромная разница. Вы получите ответы, немного развлекайтесь, и, вероятно, все равно закончите с двойной проверкой в Google или спросив реального человека, чтобы быть уверенным.