Метка: LoRA

  • LoRA-адаптация: как дообучают большие языковые модели на обычной видеокарте

    Большие языковые модели (LLM) стали одним из главных технологических прорывов последних лет. Системы вроде современных генеративных нейросетей умеют писать тексты, переводить, программировать и анализировать данные. Однако за их впечатляющими возможностями скрывается серьезная проблема: такие модели содержат миллиарды параметров и требуют огромных вычислительных ресурсов. Полное дообучение подобных систем может стоить сотни тысяч долларов и требовать кластеры…