Актуальные темы
IT Channel News
itWeek
Intelligent Enterprise/RE
Бестселлеры ИТ-рынка
BYTE/Россия

Спецпредложения

Специальные цены на оптовые закупки выделенного ассортимента товаров сетевого оборудования TENDA! Уточняйте подробную информацию у менеджеров АБСОЛЮТ
Покупайте материнские платы Gigabyte из списка на сайте NETLAB и получайте кешбэк по схеме: 50 000 – 99 999 - 5,5% 100 000 – 299 999 - 6,5% от 300 000 и более - 7% Внимание! Бюджет программы ограничен, акция может быть закончена раньше заявленного срока. Чтобы получить ...
Мы запускаем весеннюю промопрограмму на принтеры URSA UR520DE! UR520DE – настольный принтер прямой термопечати, который ценят за: ▶ Простоту — интуитивно понятный дизайн и автоматическая калибровка ▶ Надёжность — увеличенный ресурс печатной головки и регулирующих датчиков ▶ Скорость печати — ...
Уважаемые партнеры! Treolan приглашает вас принять участие в новой маркетинговой программе по мониторам Acer. Покупая мониторы Acer в Treolan, вы накапливаете баллы, которые сможете обменять на электронные подарочные сертификаты на ваш выбор. Для участия в программе необходимо зарегистрироваться
Уважаемые партнеры! Treolan приглашает вас принять участие в маркетинговой программе. Закупая участвующие в акции ноутбуки, вы получаете сумку для ноутбука IRBIS в подарок. Для участия в программе необходимо зарегистрироваться
12345Все

RAG vs. тонкая настройка ИИ-модели: какой подход правильный?

01.07.2024  Экспертиза, Искусственный интеллект

В быстро развивающейся области искусственного интеллекта существует два популярных метода расширения возможностей языковых моделей: генерация с расширенным поиском (retrieval-augmented generation, RAG) и тонкая настройка (fine-tuning). У каждого подхода есть свои сильные стороны и области применения, поэтому очень важно понимать, когда следует использовать один из них, а когда другой, пишет на портале The New Stack Асмита Ратис, инженер по машинному обучению QueryPal. Как работает RAG RAG извлекает релевантные документы из обширного массива (обычно это база данных) на основе точного совпадения или сходства с применением различных подходов к поиску: лексический, семантический и гибридный поиск. Получив необходимую информацию, можно сгенерировать ответы на ее основе. Такой гибридный подход использует возможности уже имеющихся знаний, предоставляя подробные, контекстуально релевантные ответы. Области применения RAG Корпоративный поиск. RAG особенно часто используется в корпоративных поисковых системах, где целью является предоставление точных и релевантных ответов на основе большого объема знаний. Чат-боты. RAG может значительно повысить точность и оперативность ответов благодаря использованию обширной базы данных предыдущих взаимодействий и баз знаний. Управление знаниями. Постоянно получая самую свежую информацию, RAG обеспечивает актуальность ответов, что делает его идеальным для работы в условиях, когда информация меняется. Преимущества RAG Точность и актуальность ... читать далее.

Рекомендовано к прочтению


Каждый пятый пользователь нейросетей в России планирует с их помощью поездки
На фоне активного внедрения нейросетей в повседневную жизнь «Лаборатория Касперского» решила изучить, как пользователи применяют ИИ в сценариях, связанных с путешествиями. Так, каждый пятый россиянин, который использует нейросети, планирует с их помощью свои поездки, в частности ищет рекомендации ...

Forrester: топ-10 перспективных технологий-2026
Искусственный интеллект покинул чат — в буквальном смысле. После многих лет существования внутри экранов и цифровых рабочих процессов ИИ в 2026 г. выходит в физический мир. Он проникает в роботов, транспортные средства и окружающие среды, которые находятся над приложениями и веб-сайтами, которыми ...

Почему ИИ стал опорой для небольших команд в сложных B2B-нишах
Предисловие: о реальности ИИ в B2B Чтобы не выглядеть голословным в теме, где слишком легко манипулировать цифрами и с уверенным видом рассказывать, как прекрасно работают исходящие звонки ИИ-ассистентов по базе потенциальных клиентов, сразу оговорюсь: где-то они, возможно, и работают. Но точно не ...

АПРИ и Napoleon IT сократили время проверки строительных актов в 8 раз — с помощью LLM вместо сметчика
АПРИ и Napoleon IT внедрили систему семантического сопоставления строительных документов на базе LLM: время обработки одного акта КС-2 сократилось с 40–60 минут до 5–10, формирование сводной ведомости по подрядчикам — с рабочего дня до нескольких минут. При опытной эксплуатации система выявила ...

ИСИЭЗ НИУ ВШЭ: ИИ трансформирует спрос на компетенции работников
Искусственный интеллект становится мощным драйвером перемен на рынке труда. Институт статистических исследований и экономики знаний (ИСИЭЗ) НИУ ВШЭ на основе анализа вакансий, размещенных на портале HH.ru, разработал классификацию пользователей ИИ, включающую пять категорий, и выделил для каждой ...
     
Forrester: топ-10 перспективных технологий-2026
Искусственный интеллект покинул чат — в буквальном смысле. После многих лет существования внутри экранов и цифровых рабочих процессов ИИ в 2026 г. выходит в физический мир. Он проникает в роботов, транспортные средства и окружающие среды, которые находятся над приложениями и веб-сайтами, которыми ...

Консолидации стека данных: в чем могут ошибаться инженерные руководители
Анил Инамдар, руководитель Data Services в NetApp Instaclustr, рассказывает на портале The New Stack о том, почему консолидация стека данных создает скрытый архитектурный долг и как инженерные руководители могут защитить автономию своих команд. Когда IBM объявила о приобретении Confluent (вскоре ...

Почему ИИ стал опорой для небольших команд в сложных B2B-нишах
Предисловие: о реальности ИИ в B2B Чтобы не выглядеть голословным в теме, где слишком легко манипулировать цифрами и с уверенным видом рассказывать, как прекрасно работают исходящие звонки ИИ-ассистентов по базе потенциальных клиентов, сразу оговорюсь: где-то они, возможно, и работают. Но точно не ...

Чем больше вы контролируете, тем меньше управляете
В статье расскажу, почему постоянный контроль разрушает команду и как выстроить делегирование эффективно. Парадокс контроля Есть одна картина, которую я наблюдаю с пугающей регулярностью. Руководитель работает больше всех в команде. Проверяет каждое решение. Согласовывает каждый подход. Лично ...

Как рабочие нагрузки ИИ меняют дизайн дата-центров
Рабочие нагрузки искусственного интеллекта меняют подход к проектированию центров обработки данных, определяя переход от жесткого резервирования к гибкости, адаптированной под конкретные потребности, пишет на портале Data Center Knowledge Харкс Сингх, технический директор и соучредитель ...

Лидеры читательского рейтинга

Подборка по дате

Апрель 2026
ПнВтСрЧтПтСбВс
  12345
6789101112
13141516171819
20212223242526
27282930   

© 1991–2026 ITRN (Российская служба ИТ-новостей). Политика конфиденциальности персональных данных. 109147 г. Москва, ул. Марксистская, 34, строение 10. Телефон: +7 495 974-22-60. Факс: +7 495 974-22-63. Электропочта: itrn@itrn.ru.
Версия 21.3.  Создание сайта — студия iMake.