
Дослідницька група Google анонсувала TurboQuant — алгоритм для ущільнення пам’яті, призначений для ШІ. Користувачі мережі побачили в розробці аналогію з технологією стартапу Pied Piper з телесеріалу “Силіконова долина”.
TurboQuant — новий Pied Piper pic.twitter.com/iMAYJs02zt
— Justin Trimble (@justintrimble) March 25, 2026
TurboQuant суттєво зменшує вимоги до ресурсів для функціонування великих мовних моделей і систем пошуку на основі векторів.
ШІ працює зі складними багатовимірними масивами, де зберігаються відомості про слова або зображення. Ці дані займають значний обсяг у кеші та уповільнюють створення відповідей. Звичні методи ущільнення вимагають збереження додаткових параметрів, що часто зводить нанівець переваги від оптимізації.
TurboQuant розв’язує проблему надмірного використання пам’яті за допомогою двох механізмів. Перший алгоритм перетворює вектори у полярну систему координат і проводить ущільнення основного обсягу даних. Другий діє як математичний регулятор, застосовуючи лише один біт пам’яті для усунення залишкових прихованих неточностей.
Глава Cloudflare Меттью Прінс порівняв алгоритм із результатами китайської моделі DeepSeek, яка раніше продемонструвала високу продуктивність при мінімальних витратах на апаратне забезпечення.
Це DeepSeek від Google. Ще дуже багато простору для оптимізації інференсу ШІ за швидкістю, використанням пам’яті, енергоспоживанням і мультиорендним використанням. Багато команд у @Cloudflare зосереджені на цих напрямах. #staytuned https://t.co/hHoY4sLT2I
— Matthew Prince (@eastdakota) March 25, 2026
Розробники випробували технологію на відкритих моделях Llama, Gemma та Mistral. Алгоритм ущільнив кеш до трьох біт без втрати якості відповідей. Використання пам’яті знизилося як мінімум у шість разів, а швидкість обчислень на графічних прискорювачах H100 зросла у вісім разів.
Інновація не потребує додаткового навчання нейромереж. Згідно із заявою корпорації, технологію інтегрують у пошукові алгоритми та власні ШІ-продукти, наприклад Gemini. Офіційна презентація проєкту відбудеться на спеціалізованих конференціях ICLR і AISTATS у 2026 році.
Нагадаємо, 25 березня Google повідомила про свої плани щодо переходу на постквантову криптографію.
