Сховище, а не кремній, стане поштовхом до наступного прориву в AI

Дебати щодо обробки графічної потужності — це стара новина. Ті, хто успішно розвиватиметься в майбутньому, будуть ті, хто оволодіє тим, де зберігаються дані. Оскільки глобальне створення даних продовжує вибухати, компанії, що відстають, залишаться за межами наступного етапу інновацій.

Резюме

  • Обсяги даних вибухово зростають, і передбачається, що їх глобальне створення перевищить 200 зетабайтів до кінця 2025 року, що більше, ніж весь попередній людський внесок разом узятий.
  • Централізоване хмарне сховище є вузьким місцем штучного інтелекту, збільшуючи витрати до 80% через витрати на вихідні дані та уповільнюючи великомасштабні передачі даних до кількох днів.
  • Децентралізовані мережі зберігання пропонують рішення, розподіляючи дані по незалежних вузлах і вбудовуючи криптографічні докази для аудиторських слідів, готових до відповідності.
  • Регулювання, подібне до Закону про штучний інтелект ЄС, підвищує ставки, змушуючи доводити походження даних, роблячи зберігання стратегічним пріоритетом, а не фоновою утилітою.

Створення даних, за прогнозами, досягне 200 зетабайтів у всьому світі до кінця 2025 року; цього достатньо, щоб транслювати кожен фільм, коли-небудь створений, більше 100 мільярдів разів. Ця оцінка включає більше цифрового матеріалу, ніж людство створило за всі попередні роки разом.

У зв'язку з цим зростанням, дослідницькі групи представили першу публічно випущену трильйонну мовну модель. Ця гігантська модель, чий навчальний корпус сам по собі заповнив би цілі національні архіви десять років тому, є прикладом такого Левіафана, який споживає петабайти на годину.

Без сховищ, які можуть поглинати, підготовлювати та транслювати дані на цих нових масштабах, навіть найшвидші процесори страждатимуть від бездіяльного розчарування.

Централізовані хмари є новим вузьким місцем

Більшість організацій все ще покладаються на невелику кількість гіпермасштабних сховищ, розроблених для веб-додатків, а не для передових наукових досліджень. Фінансовий тягар жорстокий.

Аудит галузі, опублікований у квітні, виявив, що приховані витрати на вихід і отримання можуть збільшити реальні витрати на зберігання до 80%, роблячи рутинне перепідготовку моделей затратним заходом. І ще гірше, переміщення десятків петабайтів між регіонами може зайняти дні; вічність, коли конкурентна перевага вимірюється в циклах ітерацій.

Централізація, отже, робить більше, ніж просто завищує рахунки; вона безпосередньо вбудовує нерівність у економіку штучного інтелекту, надаючи incumbents з глибшими кишенями автоматичну перевагу над усіма іншими. У відповідь на цю реальність, інший план набирає обертів, оскільки децентралізовані мережі зберігання, які фрагментують дані по тисячах незалежних вузлів, прокладають шлях до майбутнього, побудованого на рівних умовах.

Також важливою є потреба в прозорих аудиторських слідах, які задовольняють зростаючі вимоги щодо розкриття інформації про те, як отримуються, кураторуються та управляються дані торгівлі. Врешті-решт, регулювання стане вирішальним фактором у тому, чи побачать моделі завтрашнього дня світло, чи зіткнуться з судовими позовами.

Новий стрес-тест зберігання

Штучний інтелект в реальному часі тепер виходить далеко за межі стін центрів обробки даних, розширюючи масштаби моделей до виробничих площ, лікарень і автономних транспортних засобів. На цих краях мілісекунда, втрачена через повільний ввід/вивід, може викликати виробничу помилку або ризик для безпеки.

Останні бенчмарки MLPerf Storage v2.0 підтверджують навантаження: контрольна точка навантаження класу GPT на 10 000 прискорювачах тепер займає 37 секунд, а навіть суперкластер з 100 000 GPU все ще затримується на 4,4 секунди, чекаючи на диски, а не виконуючи математичні операції.

Якщо трубопроводи не зможуть доставляти петабайти за один раз, а потім реплікувати ті ж дані на тисячах мікросайтів, то «крайній ШІ» залишиться більше ключовою темою, ніж реальністю. Аналітики вже повторюють попередження, що пропускна здатність зберігання, а не пам'ять чи мережа, стане головним вузьким місцем, що стримує кластери наступного покоління.

Регуляція додає ще один рівень терміновості, наприклад, Акт Європейського Союзу про ШІ, який вступив у свою другу хвилю виконання 2 серпня — змушуючи постачальників загальних моделей документувати кожен фрагмент навчальних даних... або ризикувати штрафами до 7% від світового обороту.

Централізовані силоси борються за виконання цього мандату. Дубльовані копії розмивають походження, а непрозорі журнали виходу роблять аудиторські сліди справжнім кошмаром для бухгалтерів. На відміну від цього, децентралізовані мережі вбудовують криптографічні докази реплікації у свою саму структуру, перетворюючи відповідність у побічний продукт, а не в дорогий додаток.

Ігноруйте зберігання за рахунок небезпеки

З затримкою на краю, виміряною в мікросекундах, і юридичними штрафами, виміряними в мільярдах, зберігання більше не є фоновою утилітою; це єдиний субстрат, на якому завтра ШІ може легально і фізично працювати. Компанії, які досі розглядають ємність як товарний рядок, ризикують отримати технічний борг і регуляторний шок в рівній мірі.

Інновації в обчисленнях продовжать привертати увагу, але без такої ж радикальної переосмислення того, де ( і як) дані зберігаються, найсучасніший кремній буде бездіяльним, оскільки витрати та ризики дотримання зростатимуть.

Гонка за домінуванням у сфері ШІ розпочалася, і її виграють ті, хто підніме зберігання до першокласного стратегічного пріоритету, прийме децентралізацію та створить готові до аудиту конвеєри, які масштабуются від ядра до краю. Всі інші виявлять, що жодна кількість потужності GPU не може обігнати вузьке місце, закладене у самі основи їхнього стеку.

! Kai Wawrzinek

Кай Вавжинек

Кай Вавжинек є співзасновником Impossible Cloud та Impossible Cloud Network. Він досвідчений підприємець з докторським ступенем у галузі права та доведеним досвідом створення успішних підприємств. Визнаючи потребу в рішеннях корпоративного класу у просторі web3, Кай заснував Impossible Cloud Network (ICN), децентралізовану хмарну платформу, спрямовану на створення децентралізованої альтернативи AWS. Перед ICN Кай заснував Goodgame Studios, компанію з онлайн-ігор, і збільшив кількість співробітників компанії до понад 1 000, отримавши понад 1 мільярд євро доходу, вийшовши на публічний ринок на Nasdaq у 2018 році через зворотне злиття.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити