• Купить
  • Продать
  • Форум
Среда, 15 апреля, 2026
  • Login
  • Регистрация
iStorka - новости криптовалют сегодня
  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ
Нет результатов
Смотреть все результаты
  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ
Нет результатов
Смотреть все результаты
iStorka
Нет результатов
Смотреть все результаты
Главная forklog.com

Высечь в камне

Zordan by Zordan
11.03.2026
В forklog.com
58 0
0
44
Поделилось
1.5k
Просмотров
ВкПоделиться в Telegram

img-e85279aa380bface-8456330719811929

Related articles

В K33 увидели признаки разворота биткоина после 68 дней консолидации

В K33 увидели признаки разворота биткоина после 68 дней консолидации

15.04.2026
Аналитики Bernstein предрекли платформам прогнозов рост до $1 трлн

Аналитики Bernstein предрекли платформам прогнозов рост до $1 трлн

15.04.2026

Как ИИ-чипы преодолевают «стену памяти»

Традиционно потребительские GPU предназначены для видеоигр и рендеринга. Однако им под силу выполнять и другие задачи, требующие параллельных вычислений

На графическом процессоре можно запустить, например, PoW-майнер для добычи криптовалют, но в условиях конкуренции со специализированным оборудованием GPU-фермы стали решением для нишевых проектов. 

Похожая ситуация складывается в сфере ИИ. Видеокарты стали основным вычислительным инструментом для нейронных сетей. Но по мере развития индустрии возник спрос на специализированные решения для работы с ИИ. ForkLog разобрался в актуальном состоянии нового витка гонки в области искусственного интеллекта.

Оптимизация кремния для ИИ

Существует несколько подходов к созданию специализированного оборудования для задач искусственного интеллекта.

Потребительские GPU можно считать отправной точкой на пути специализации. Их способность работать с параллельными матричными вычислениями пригодилась для развертывания нейросетей и особенно глубокого обучения, но пространства для улучшений оставалось достаточно.

Одна из главных проблем ИИ на видеокарте — необходимость постоянно перемещать большие объемы данных между системной памятью и GPU. Эти сопроводительные процессы могут отнимать больше времени и энергии, чем сами полезные вычисления.

Другая проблема GPU проистекает из их универсальности. Архитектура видеокарт рассчитана на широкий спектр задач — от рендеринга графики до вычислений общего назначения. В результате часть аппаратных блоков оказывается избыточной для специализированных ИИ-нагрузок.

Отдельным ограничением выступает формат данных. Исторически графические процессоры оптимизировались под операции с FP32 — 32-битными числами с плавающей запятой. Для инференса и обучения обычно применяют форматы меньшей точности: 16-битные FP16 и BF16, целочисленные INT4 и INT8.

Nvidia H200 и B200

Одни из популярнейших продуктов для инференса и обучения — чипы H200 и серверные системы DGX B200 — по большому счету представляют собой «усиленные» GPU для дата-центров.

Основной ИИ-ориентированный элемент этих ускорителей — тензорные ядра, предназначенные для сверхбыстрых матричных операций вроде обучения моделей и пакетного инференса.

Чтобы сократить задержки при доступе к данным, Nvidia оборудует свои карты огромным объемом высокопроизводительной памяти (HBM, High Bandwidth Memory). В H200 встроено 141 ГБ HBM3e с пропускной способностью 4,8 ТБ/с, в B200 эти показатели еще больше в зависимости от конфигурации.

Tensor Processing Unit

К 2015 году в Google разработали Tensor Processing Unit (TPU) — ASIC-процессор на основе систолических массивов, предназначенный для машинного обучения.

Tensor_Processing_Unit_3.0
Tensor Processing Unit 3.0. Источник: Wikipedia.

В архитектуре конвенциональных процессоров — CPU и GPU — каждая операция предусматривает считывание, обработку и запись промежуточных данных в память. 

TPU пропускает данные через массив блоков, каждый из которых проводит математическую операцию и передает результат следующему. Обращение к памяти происходит только в начале и в конце последовательности вычислений.

Такой подход позволяет тратить меньше времени и энергии на ИИ-вычисления, чем неспециализированный графический процессор, однако работа с внешней памятью остается сдерживающим фактором.

Cerebras 

Американская компания Cerebras нашла способ использовать в качестве процессора цельную пластину кремния, которую обычно нарезают на меньшие элементы для производства чипов.

В 2019 году разработчики представили свой первый 300-мм Wafer-Scale Engine. В 2024 компания выпустила усовершенствованный процессор WSE-3 с 460-мм чипом на 900 000 ядер.

image
Cerebras WSE-3 и два чипа Nvidia B200. Источник: Cerebras.

Архитектура Cerebras подразумевает распределение блоков памяти SRAM в непосредственной близости от модулей логики на той же пластине кремния. При этом каждое ядро работает с собственными 48 КБ локальной памяти и не конкурирует с другими ядрами за доступ.

По словам разработчиков, многим моделям для инференса хватает одного WSE-3. Для более масштабных задач предусмотрена возможность собрать кластер из нескольких таких чипов.

Groq LPU

Компания Groq (не путать с Grok от xAI) предлагает собственные ASIC для инференса на основе архитектуры Language Processing Unit (LPU). 

image
Чип Groq. Источник: Groq.

Одна из ключевых особенностей чипов Groq заключается в оптимизации под последовательные операции. 

Инференс полагается на поочередную генерацию токенов: каждый шаг требует финализации предыдущего. В таких условиях производительность в большей степени зависит от скорости работы одного потока, нежели от их количества. 

В отличие от привычных процессоров общего назначения и некоторых ИИ-специализированных устройств, Groq не формирует машинные инструкции по ходу выполнения задачи. Каждая операция заранее спланирована в своеобразном «расписании» и привязана к конкретному моменту в работе процессора.

При этом, как и ряд других ИИ-акселераторов, LPU совмещает модули логики и памяти на одном чипе для минимизации затрат на перенос данных. 

Taalas

Все перечисленные выше примеры подразумевают высокую степень программируемости. Модель и необходимые веса загружаются в перезаписываемую память. В любой момент оператор может загрузить абсолютно другую модель или внести коррективы.

С таким подходом производительность зависит от доступности, скорости и объема памяти.

Разработчики из Taalas пошли дальше, решив «зашить» конкретную модель с готовыми весами прямо в чип на уровне архитектуры транзисторов.

Модель, которая обычно выступает программным обеспечением, реализуется на аппаратном уровне, что позволяет отказаться от отдельного универсального хранилища данных и связанных с ним затрат.

В своем первом решении — инференс-карте HC1 — компания использовала открытую модель Llama 3.1 8B. 

image
Taalas HC1. Источник: Taalas.

Карта поддерживает низкобитовую точность вплоть до 3-битных и 6-битных параметров, что позволяет ускорить обработку. Согласно собственным заявлениям Taalas, HC1 обрабатывает до 17 000 токенов в секунду, оставаясь сравнительно дешевым устройством с низким энергопотреблением. 

Фирма заявляет о тысячекратном приросте производительности в сравнении с GPU в пересчете на энергопотребление и стоимость.

Однако у такого метода есть фундаментальный недостаток — невозможность обновить модель без полной замены чипа. 

В то же время HC1 снабдили поддержкой LoRA — метода «донастройки» LLM через добавление дополнительных весов. С правильной LoRA-конфигурацией модель можно превратить в специалиста в конкретной области.

Другая сложность связана с процессом дизайна и производства таких «физических моделей». Разработка ASIC стоит больших денег и может занимать годы. В условиях высокой конкуренции ИИ-индустрии это существенное ограничение.

В Taalas заявляют о новом методе генерации архитектуры процессора, призванном решить эту проблему. Автоматическая система превращает модель и набор весов в готовый дизайн чипа в течение недели. 

По собственным оценкам компании, производственный цикл от получения новой ранее неизвестной модели до выпуска готовых чипов с ее физическим воплощением будет занимать около 2 месяцев. 

Будущее локального инференса

Новые специализированные ИИ-чипы прежде всего занимают места в массивных установках дата-центров, обеспечивая облачные услуги за плату. Нетривиальные решения вплоть до «физических моделей», реализованных прямо в кремнии, не исключение. 

Для потребителя революционный инженерный прорыв выразится в удешевлении услуг и ускорении работы. 

В то же время появление более простых, дешевых и энергоэффективных чипов создает предпосылки для популяризации локальных решений для инференса. 

Уже сейчас специализированные ИИ-чипы есть в смартфонах и ноутбуках, камерах наблюдения и даже дверных звонках. Они позволяют выполнять задачи локально, обеспечивая низкую задержку, автономность и приватность.

Радикальная оптимизация, пусть и за счет гибкости в выборе и замене модели, существенно расширяет возможности таких устройств и позволяет интегрировать простые ИИ-компоненты в дешевые массовые продукты.

Если большинство пользователей начнет направлять свои запросы на модели, работающие на локальных устройствах, нагрузка на мощности дата-центров может снизиться, уменьшая риск перегрузки отрасли. Быть может, тогда не придется искать радикальные пути увеличения вычислительных мощностей — вроде их запуска на орбиту. 

Подписывайтесь на ForkLog в социальных сетях

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Источник: forklog.com

Теги: #nvidiaFORKLOGБлокчейнИскусственный интеллектКриптовалютаЛонгридычипы
Поделиться2ПоделитьсяСканировать

Похожее:Записи

В K33 увидели признаки разворота биткоина после 68 дней консолидации
forklog.com

В K33 увидели признаки разворота биткоина после 68 дней консолидации

by Zordan
15.04.2026
0

Отрицательная ставка финансирования на рынке деривативов при росте котировок первой криптовалюты создает условия для шорт-сквиза. Об этом заявили аналитики K33. ...

Читать еще
Аналитики Bernstein предрекли платформам прогнозов рост до $1 трлн

Аналитики Bernstein предрекли платформам прогнозов рост до $1 трлн

15.04.2026
Microsoft представит аналог OpenClaw

Microsoft представит аналог OpenClaw

15.04.2026
Радикальный план защиты биткоина от квантовых компьютеров возмутил сообщество

Радикальный план защиты биткоина от квантовых компьютеров возмутил сообщество

15.04.2026
OpenAI ответила Anthropic релизом ИИ-модели GPT-5.4-Cyber

OpenAI ответила Anthropic релизом ИИ-модели GPT-5.4-Cyber

15.04.2026
Загрущить еще

Обсуждение: post

  • Интересно:
  • Комментарии
  • Последнее
Отчет Binance Research: как прошел 2025 год и что ждет криптоиндустрию в 2026

Полный и подробный гайд STEPN: Код активации, кроссовки, как играть и сколько можно заработать

18.01.2026
Биржа Lighter ввела обязательный стейкинг для пула ликвидности

ТОП-4 кошелька для стейкинга криптовалют

18.01.2026
Lemon запустил в Аргентине кредитную карту с обеспечением в биткоинах

ТОП-9 криптовалют для стейкинга: Как выбрать токен и запустить стейкинг?

18.01.2026
Вестник DeFi: TVL вырос на 15% за месяц, а Curve анонсировала стейблкоин

Вестник DeFi: TVL вырос на 15% за месяц, а Curve анонсировала стейблкоин

18.01.2026
Банк в ЕС запустит регулируемый трейдинг биткоином и Ethereum

Биткоин взял паузу перед взятием $24000 и взлётом к $30000

0
Interactive Brokers добавил поддержку депозитов в USDC через Solana и Base

Капитализация стейблкоина Tether превысила $20 млрд

0
Экс-мэр Нью-Йорка опроверг обвинения в рагпуле после обвала NYC Token

Транзакционные сборы в сети биткоина выросли в два раза на этой неделе

0
В JPMorgan спрогнозировали приток крупных игроков в криптоиндустрию

Аналитик MCM Partners ставит на рывок биткоина до $25 000

0
Госдума установила штрафы до 2 млн рублей за нелегальный майнинг

Госдума установила штрафы до 2 млн рублей за нелегальный майнинг

15.04.2026
В K33 увидели признаки разворота биткоина после 68 дней консолидации

В K33 увидели признаки разворота биткоина после 68 дней консолидации

15.04.2026
Рост потоков биткоина на фьючерсы: сигнал конца медвежьего рынка?

Рост потоков биткоина на фьючерсы: сигнал конца медвежьего рынка?

15.04.2026
Высечь в камне

Crypto.com раздаст $1 млн в бонусах бойцам UFC на турнире в Белом доме

15.04.2026
iStorka

Агрегатор: новости криптовалют сегодня

Метки

#цена Binance bitcoin BITS COINSPOT Cryptocurrency DeFi ETF ethereum FORKLOG HASHTELEGRAPH NFT PROFITGID SEC WHATTONEWS yandex Аналитика Банк Безопасность Бизнес Бизнес идеи Биржа криптовалют Биржи Биткоин Блокчейн В помощь бизнесмену Инвестиции Интернет-бизнес Искусственный интеллект Комбо дня Криптовалюта Криптовалюты Майнинг Новости Платформа Регулирование Риск Россия США Стейблкоин Суд Токен Транзакция Трейдинг Эфириум

Последние записи

Госдума установила штрафы до 2 млн рублей за нелегальный майнинг

Госдума установила штрафы до 2 млн рублей за нелегальный майнинг

by Zordan
15.04.2026
0

Государственная дума приняла в первом чтении законопроект об административных штрафах за нарушения законодательства о добыче криптовалют. Поправки, дополняющие главу 15...

В K33 увидели признаки разворота биткоина после 68 дней консолидации

В K33 увидели признаки разворота биткоина после 68 дней консолидации

by Zordan
15.04.2026
0

Отрицательная ставка финансирования на рынке деривативов при росте котировок первой криптовалюты создает условия для шорт-сквиза. Об этом заявили аналитики K33. ...

© 2021 iStorka - новости криптовалют сегодня

Разрешается частичное копирование материалов сайта при условии наличия активной ссылки на источник.

Любые предложения и пожелания вы можете присылать на адрес info@istorka.ru

iStorka - работает для вас

  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ
Нет результатов
Смотреть все результаты
  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ

© 2021 iStorka - новости криптовалют сегодня.

С возвращением!

Войти в аккаунт

Забыли пароль? Подписаться

Создать новый аккаунт

Заполните поля для регистрации

Все поля обязательны Войти

Повторите пароль

Укажите детали для сброса пароля

Войти

Add New Playlist

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?