Apple a10

Графика и LTE модем

Что касается графики, оба чипсета использую свою собственную графическую систему. У Qualcomm Snapdragon 821 — это Adreno 530 GPU с тактовой частотой 650 МГц. Apple ранее использовала графику PoweVR GPU от компании Imagination Technologies. Но с процессором 10 Fusion она перешла на графический чип собственной разработки на 6 ядер. Официального названия у графики Apple до сих пор нет.

Snapdragon 821 поддерживает OpenGL ES 3.2 и Vulkan 1.0, в то время, как A10 Fusion — OpenGL ES 3.0 и Metal API (собственную разработку Apple). Еще одним различием между чипсетами является поддержка быстрой зарядки Quick Charge 3.0 в SD 821 и ее отсутствие в Apple. Также SoC Snapdragon 821 имеет встроенный на кристалле модем X12 LTE, в то время, как Apple A10 не имеет встроенного LTE модема и использует стороннее решение на отдельном чипе.

Главные особенности А10

  • Увеличения количества физический ядер на две штуки.
  • Сохранении старого 16-нанометрового техпроцесса производства.
  • Более крупный размер кристалла А10 по сравнению с А9.

Фото: Сравнение Apple A10 характеристик и параметров других микропроцессоров.

Отказ от перехода на 14 нанометров, скорее всего, был связан с большими объемами производства, которое было бы слишком усложнено переходом на более свежую технологию. Однако сохранение накатанной схемы производства дало возможность компании больше уделить времени на оптимизацию, причем как готовых продуктов, так и самого чипа и его архитектуры.

Артефакт из Фруктовой галактики

Кроме инженеров Apple и ARM, оторвавшихся по полной в процессе создания Apple A10, и пользователей получивших в свои руки продукт высоких технологий и вдохновения, были и другие счастливчики, испытавшие ни с чем несравнимое удовольствие от раскрытия очень непростых загадок природы. Про Apple A10 Fusion в концертном зале имени Билла Грэма сказали много слов, и не сказали практически ничего.

Вы еще тратите время на пошлые ребусы и кроссворды?

Расшифровать подробности и доказать правильность своей интерпретации было очень непросто, это требовало высочайшей квалификации и глубоких знаний. На этом пути было сделано много ошибок – которые были исправлены, со временем.

Даже сверхсовременный и дорогущий комплекс технических средств, включающий в себя мощный электронный микроскоп, не способен дать окончательный ответ на все вопросы.

Первая расшифровка снимков с “обратной стороны рукотворной Луны” была ошибочной, именно она опубликована в большинстве очерков о новой системе-на-чипе:

Неверная расшифровка:

К чести для ребят из Chipworks, они сомневались в её правильности. Признать её точной мешала нелогичность и отсутствие элегантности получавшейся картины. У Apple другой почерк. Поэтому – знаки вопроса.

Напряженная работа ума, дискуссии, сравнение фрагментов открывшегося ландшафта экзопланеты Apple A10 Fusion с другими ландшафтами, точные сведения о которых были приведены в технической документации иных миров (других компаний) помогли раскрыть истинную суть вещей.

Верная расшифровка:

Это тоже гипотеза. Apple не комментировала открытие добровольных исследователей, но на этот раз расшифровка более правдоподобна, лучше согласуется с результатами тестов и на 99,9% истинна.

В нашем мире есть место подвигу!

Сравниваем яблоки и апельсины

Приведу результаты нескольких испытаний, которым подвергли iPad Pro (с A12X внутри).

Время конвертации 50 RAW-файлов в файлы JPEG, с помощью Adobe Lightroom

Время потребовавшееся на перекодировку 12-минутного 4K видео, в Adobe Rush

Считается что испытания на реальных задачах более объективны. Вот только для оценки производительности процессоров самих по себе они не годятся: результат в немалой степени зависит от самых разных факторов (конструктивные особенности устройства, его конфигурация, и т.п.) Тесты вроде Geekbench раскрывают возможности самих процессоров.

Тесты Geekbench

Это продолжение серии про чипы, разработанные Apple. Предыдущая часть здесь.

Архитектура

Как видно с таблицы, оба чипсета имеют 64-битную архитектуру и 4 вычислительные ядра в своем составе. Такая конструкция была создана ARM, она называется big.LITTLE Heterogeneous Multi-Processing (HMP) и означает, что не все ядра в кластере равны между собой. У Snapdragon 821 два ядра работают на частоте 2.4 ГГц на ядро и два — на 2.0 ГГц. У чипа от Apple применяется такая же конструкция, максимальная тактовая частота процессора достигает отметки 2.34 ГГц на ядро.

Это сделано с той целью, чтобы процессор мог выдавать максимальную производительно в тяжелых приложениях, а в слабеньких процессах максимально сохранять заряд батареи. Apple A10 Fusion — первый 4-ядерный процессор от компании из Купертино, который построен на базе архитектуры big.LITTLE.

Признаки прогресса

В 2017 году ожидалось что Intel, Samsung и TSMC начнут производство микросхем по технологии 10 нм. Переход на эту технологию был сложнее чем ожидалось. В начале года с этим справились только Samsung (процесс LPE) и TSMC (процесс FinFET).

Поскольку я об этом упомянул, вы уже догадались что все это имеет отношение к новой SoC “фруктового” гиганта. Да. Apple A10X Fusion производился по технологии 10 нм FinFET.

В TSMC работали над процессом 7 нм, считая процесс 10 нм короткой остановкой на пути в будущее – но об этом мы поговорим когда-нибудь потом.

A10X:

A10X была самой “мощной” из всех систем-на-чипе X-серии, при этом по размеру кристалл был самым маленьким из них – 96,4 кв.мм.

Площадь кристаллов X-серии:

Как и в Apple A10 Fusion, в A10X использовалась архитектура big.LITTLE, и те же ядра – Hurricane (Ураган) и Zephyr (Зефир, но еще и Ветерок или Бриз). В big.LITTLE используют ядра двух типов, ураганно мощные и энергосберегающие. Кто из них кто в A10X не скажу. Догадайтесь.

В A10X ядер каждого типа было по три (вместо двух в A10), если не учитывать технологию производства, внешне, ядра были практически такими же. К сожалению, привести снимок поверхности чипа с расшифровкой я не могу. Подробная информация о вскрытых чипах, в том числе и снимки с приемлемым увеличением и с аннотациями, теперь предоставляются только подписчикам и без права публикации.

В свободном доступе только это:

Максимальная тактовая частота ядер Hurricane в A10X была увеличена до 2,38 ГГц (в A10 – 2,34 ГГц).

Кэш третьего уровня в A10X отсутствует в принципе, кэш второго уровня – 8 Мегабайт.

Графический процессор – PowerVR Series 7XT GT7600 Plus в 12-кластерной конфигурации. В A10 использовался тот же GPU, только в 6-кластерной конфигурации. Эксперты вместо термина “кластер” чаще употребляют более привычный термин “ядро”, хотя PowerVR очень убедительно объяснила почему это скорее кластеры, чем ядра. Но не будем отвлекаться.

И это был не совсем PowerVR Series 7XT GT7600 Plus, но про графические процессоры поговорим чуть позже.

Помимо CPU и GPU, на кристалле располагалось много всего интересного: сопроцессор движения Apple M10, “секретный анклав”, контроллер флэш-памяти NVMe, и масса всяких совершенно секретных элементов.

Целый мир на кристалле. И да – в гонках Apple A10X Fusion показывала феноменальные результаты, сравнимые с Intel Core i7 в MacBook Pro 2015 года. В индустрии уже говорили о том что процессоры от Intel больше не нужны Apple, что компания вот-вот переведет Mac’и на ARM-процессоры собственной разработки. Но это еще одна “другая история”.

Большая МАЛЕНЬКАЯ архитектура

В 2011 году в секторе процессоров для мобильных устройств сложилась революционная ситуация. С одной стороны, чтобы не проиграть в жесточайшей конкурентной борьбе, их вычислительную мощь приходилось наращивать. А за все в мире надо платить. Большая мощь – это удлинение конвейеров, увеличение размеров кэшей всех уровней, умножение числа вычислительных юнитов. И стремительный рост числа транзисторов на кристалле, потребляющих энергию даже в состоянии “сна”.

Пиковые нагрузки, ради которых собирали всю эту рать, были эпизодическими. Большую часть времени многомиллионные армии микроскопических переключателей потребляли, дремали и ждали своего часа. Точнее, мига. Батареи разряжались все быстрее, отходы жизнедеятельности миллионов транзисторов (выделяемое ими тепло) требовалось как-то “вывозить”, иначе системе наносился непоправимый ущерб.

Так или иначе, с чем-то похожим в микроэлектронике уже сталкивались. Intel и AMD нашли собственные решения похожим проблемам, о том как это им удалось, в изложении для тех кто использует процессоры, было хорошо и широко известно. А вот конкретная суть этих решений, понятное дело, была самой охраняемой тайной лидеров отрасли.

ARM Holdings предложила своё решение: использовать в процессорах неодинаковые ядра, с разной производительностью и энергоёмкостью. “Большие”, для пиковых нагрузок, и “маленькие”, для всего остального. Архитектуру назвали big.LITTLE, и рассказали о ней в октябре 2011 года. Препятствий на пути к реализации мира вселенской мечты было много: процессор с этой архитектурой надо было научить вовремя и очень быстро включать и выключать большие или маленькие ядра. Это только верхушка айсберга, на самом деле чтобы вся эта механика заработала, процессорам требовалось освоить массу непростых трюков.

Оборотная стороны – амбициозные задачи вроде этой просто находка для талантливых инженеров, отличная возможность многому научиться, попробовать свои силы, и в конце концов это безумно интересно. А еще – каждый такой проект делает мир немного умней. И одновременно глупей (тут тоже big.LITTLE), но не будем о грустном.

Чтобы играть в эти игры, ядра обоих типов требовалось разрабатывать заново, с учетом участия в этой игре.

Стремительно-быстрое переключение между режимами занимало 20 тысяч циклов CPU. Даже при тактовых частотах в 500 МГц (в 2011 встречались и такие) это 400 микросекунд.

Изначально предполагалось что переключение будет “кластерным”, в каждую единицу времени процессор будет использовать только “большие ядра”, или только “маленькие”. 20 тысяч циклов – это цена за такой подход.

В процессе использования этой архитектуры, возникли еще два способа её применения. Переключение могло случаться независимо, в единственной паре большой-маленький, в зависимости от потребностей выполняемой этой парой задачи. И даже, хитрым и не очень элегантным образом, большим и маленьким разрешалось иногда работать одновременно.

У каждого из трех способов свои плюсы и минусы. Инженеры Apple выбрали простой и самый экономичный способ: переключаются сразу все, в любой момент работают либо только “большие”, либо только “маленькие”. Практическое число ядер при этом подходе равно половине от их физического числа – зато на порядок меньше причин ошибиться.

2-ядерный 4-ядерный процессор – это Apple A10 Fusion и некоторые его родственники. Практика – критерий истины. Топовые позиции в тестах (и в самых реалистичных, в том числе) сделали спекуляции об отсталости и интеллектуальной недостаточности Apple беспочвенными. Но уверяю вас, инженеры Apple тратили силы и время вовсе не на это.

Архитектура big.LITTLE – самое главное и заметное отличие процессора в Apple A10 от его предшественника. Но не единственное. Вокруг этой архитектуры возникло такое число предрассудков и заблуждений, что пришлось уделить ей столько времени. Извините, если что.

Ураган и Бриз

Тайной было не только расположение объектов на кристалле A10. Почти все. Процессор был разработан Apple для Apple. Для возбуждения интереса в массах о нем нельзя было не рассказать, но только самое интересное.

Остальное – результат напряженной работы десятков (сотен?) неплохих умов, доказанный и перепроверенный по всем правилам настоящей науки. Спасибо им.

В миру процессор (кодовое наименование T8010, видимо) назвали Cyclone-4. Четвертое поколение 64-битных процессоров от Apple. Заодно выяснили что именно извлекалось из plist-файлов в прежних версиях iOS. Это было имя ядер процессоров. И Swift, и Cyclone – это названия ядер. Пока он были в точности одинаковыми, это не имело значения. Теперь все было иначе.

Большие и прожорливые ядра назывались Hurricane. Ураган. Кроме одного из типов ядер в Cyclone-4 так назывался еще и британский истребитель Второй Мировой, Харрикейн. Это и в самом деле были большие ядра, на кристалле каждый из них занимал 4,18 кв.мм.

Максимальная тактовая частота Hurricane – 2,34 ГГц (в неблагоприятных условиях, при перегреве например, частота притормаживалась).

Маленькие назывались Zephyr. Помимо очевидного, у этого слова есть и другие значения, например – “легкий ветерок”, “бриз”. Площадь каждого из маленьких – 0,78 кв.мм.

Максимальная тактовая частота Zephyr – 1,05 ГГц.

Внутри корпуса, защищающего кристалл от повреждений и коррозии, использовалась новая технология компоновки элементов от TSMC, InFO. В корпусе, помимо кристалла, размещалась оперативная память производства Samsung. Либо 2 Гигабайта LPDDR4, в версии для iPhone 7, либо 3 Гигабайта – в iPhone 7 Plus.

Крышка корпуса Apple A10 Fusion для iPhone 7 Plus:

На крышке корпуса одна из криптограмм обозначала объём памяти. K3RG1G10CM-YGCH в случае конфигурации с 2 ГБ, и K3RG4G40MM-YGCH – в случае с 3 ГБ.

Система-на-чипе выпускалась TSMC, по технологии FinFET 16 нм. С Samsung не стали связываться – еще один Чипгейт Apple был ни к чему.

Графический процессор был, как ни странно, практически тем же что и в A9, PowerVR Series 7XT GT7600 Plus – вот только “Plus” сообщал о каких-то его отличиях. Те же 6 ядер, которые PowerVR упорно продолжала называть кластерами, узнаваемый рисунок ядер-кластеров на ландшафте.

Это – усовершенствованный Apple вариант PowerVR Series 7XT GT7600, в 2 раза более производительный и потребляющий немного меньше энергии чем взятый за основу GPU.

В документации Apple процессор обозначался как APL1W24, в документации TSMC как 339S00255, 339S00258 и, видимо, как-то еще – он выпускался в нескольких вариантах, в начале их было 2, потом добавились и другие. Обозначения присутствуют и на крышке процессора. 339S00258, скорее всего, обозначает вариант для iPhone 7 Plus.

Кэш второго уровня (только для CPU) – 3 Мегабайта, кэш третьего уровня (для всей SoC) – 4 Мегабайта. В точности как и у Apple A9.

И iPhone 7/7+ с Apple A10 Fusion внутри действительно “рвали” конкурентов с 6- и 8-ядерными процессорами (если согласны, вступайте в наш Telegram-чат.

С тестами использующими только одно ядро все понятно: у 2-ядерного (по его сути) процессора иначе просто не могло быть

Но результаты тестов использующих все ядра которые только доступны – обратите внимание – заставляют вспомнить про магии

Продолжение следует

Устройства с А10 на борту

iPhone 7 и iPhone 7 Plus

Очень похожие дизайном на своего предшественника, но при этом во многом благодаря Apple А10 Fusion процессору более производительные смартфоны, которые даже в 2019 году справляются на отлично с большинством приложений и мобильных игр.

Единственный значительный минус семерки, по сравнению с Plus версией – урезанный с трех до двух гигабайт объем оперативной памяти.

iPad 6 (2018)

Недорогой, бюджетный планшет, который действительно позиционирует себя как планшет. Ведь если взять тот же ультрасовременный iPad 10,5 того же (2018) года выпуска, который намного более мощнее – он может заменить собой ноутбук или даже ПК.

Однако не так уж и много людей, которые готовы полностью отказаться от ПК в пользу планшета. Зато людей, которым нужен сравнительно недорогой и производительный девайс для дороги, на котором можно почитать книжку или посмотреть фильм — более чем предостаточно.

Вот для них iPad 2018 подойдет лучше всего. Особенно если учесть, что время его автономной работы благодаря Apple A10 достигает 10 часов.

Консультант сайта appleiwatch.name, соавтор статей. Работает с продукцией Apple более 10 лет.

Богатый внутренний мир Apple A12X

В защитном корпусе с надписью A12X – сборка из модулей оперативной памяти и системы-на-чипе. Сама эта сборка – предмет гордости TSMC, её конструкция (InFO) запатентована, проверена в самых неблагоприятных условиях. В iPad Pro 2018 года в сборке кроме SoC размещаются 4 или 6 Гигабайт оперативной памяти LPDDR4X. 6 Гигабайт используется в конфигурациях iPad Pro с 1 Терабайтом флэш-памяти. Думаете, нужно столько? Поделитесь в нашем Telegram-чате.

Сборка процессора A12X

Центральный процессор A12X – 8-ядерный. Четыре из них – “силовые”, с кодовым наименованием Vortex (смерч), с тактовой частотой 2,49 ГГц. Другие четыре ядра, Tempest (буря) – энергосберегающие, с тактовой частотой в 1,49 ГГц. Скорее всего, они такие же как в 6-ядерном A12. В A12 и A12X, как и в A11, все ядра могут работать одновременно. В A10 и A10X в любой момент времени могли быть активны только ядра одного типа, либо “силовые”, либо энергосберегающие. По традиции, производительность силовых ядер в системах-на-чипе от Apple впечатляет. Теперь, благодаря умному диспетчеру нагрузки, результат совместной работы всех ядер тоже неплох. Он чуть хуже чем у лучших Core i7, но ненамного.

Блок-схема Apple A12X Bionic

Графический процессор 7-ядерный, разработанный Apple. По мнению экспертов, каждое ядро GPU состоит из двух кластеров. Производительность GPU – 1 300 GFLOPS, больше чем у самых мощных встраиваемых GPU от Intel. Но важнее всего для “яблочного” GPU поддержка Metal 2, в графическом процессоре A12X с этим все нормально. Кроме GPU в работе с графикой принимает участие еще несколько процессоров, и NPU, нейронный 8-ядерный процессор с производительностью в 5 триллионов 8-битных операций в секунду. Кодовое наименование NPU в A12 и A12X – Quin. SEP (процессор анклава безопасности), доступ к которому открыт только внутри SoC, хранит чувствительных данные, например от FaceID.

Производительность

Процессор Snapdragon 821 можно посчтитеть более производительным, так как для сравнительно одинаковой архитектуры и частоты, он построен на меньшем технологическом процессе (14 нм против 16 нм). Также это положительно скажется на меньшем потреблении энергии. Но в популярных бенчмарках, вроде AnTuTu, Geekbench и Basemark OS III, Apple A10 Fusion набирает большее количество баллов, чем SoC от Qualcomm.

Стоит отметить, что производительность будет еще разниться от устройства к устройству, ведь производители используют разную степень оптимизации железа и софта, а также разный «обвес» процессора: оперативная и флеш-память и прочее.

Два ядра хорошо, а четыре лучше

Вместе с добавлением двух дополнительных ядер была добавлена:

  • Система изменения частоты и напряжения в реальном времени, причем, с отключением как целых ядер, так и отдельных вычислительных блоков. Это дало много гибкости как в энергопотреблении, так и в производительности процессора;
  • В iPhone 7 был добавлен новый контроллер, позволяющий более эффективно распределять нагрузку между ядрами или загружать только некоторые из них
  • Была создана специальная схема деления кэш-памяти процессора на каждое из ядер, что позволяет, когда это необходимо, отдельному ядру решать задачи самостоятельно, не обращаясь при этом к кэш-памяти других ядер
  • Ну, и конечно был увеличен в два раза размер третьего уровня кэша памяти процессора с 4 до 8 мегабайт.

Сравнение характеристик

Snapdragon 821 A10 Fusion
Тех процесс 14 нм 16 нм
Ядра 64-бит, 4 ядра 2x Kryo 2.4 ГГц + 2x Kryo 2.0 ГГц 64-бит, 4 ядра, 2x Hurricane 2.34 ГГц + 2x Zephyr
Вычисления на ядро на кластер
Графика Adreno 530 GPU 650 МГц 6-ти ядерная графика
тип ОЗУ LPDDR4, 1866 МГц LPDDR4
4G LTE X12 LTE Cat 12/13 нет данных
Зарядка Qualcomm Quick Charge 3.0 нет данных
Поддержка графики OpenGL ES 3.2, Open CL 2.0,
Vulkan 1.0,
DX11.2
OpenGL ES 3.0, Metal
Видео запись 4K Ultra HD видео с частотой кадров в секунду 30 fps. Проигрывание 4K/30fps видео запись 4K Ultra HD видео с частотой кадров в секунду 30 fps. Проигрывание 4K/30fps видео
Кодеки H.264 (AVC) +
H.265 (HEVC)
H.264 (AVC) + H.265 (for Facetime?)
Wi-Fi 802.11ac 802.11ac

Гонки и выводы

В одной из статей, сравнивавших Apple A11 Bionic с Qualcomm Snapdragon 845, сначала сравнивались спецификации участников поединка. По всем сравниваемым параметрам Snapdragon или превосходил Bionic’а, или они были равны. Ядер больше (8 против 6), оперативная память у обоих противников LPDDR4X, но у Snapdragon её контроллер 2-канальный, более передовой DynamicIQ у Snapdragon вместо ассиметричного Fusion у A11, а результат – победил Apple A11 Bionic, с приличным отрывом. Вопреки всему.

Авторы пришли к выводу что гонки были нечестными: ядра ARM Corteх A75, используемый в Snapdragon 845 – универсальные, их эффективность зависит от особенностей смартфона в котором они применяются. А Apple A11 Bionic разработан специально для iPhone 8/8 Plus/X, и тщательно оптимизирован именно для них. Ну и – больше транзисторов на SoC, я бы к этим рассуждениям добавил яблочко на крышке SoC. Потому что именно так все и было задумано.

А эксперты, оценивая положение дел в процессорной индустрии, пришли к выводу что в победах Apple ничего удивительного нет. Отдел микроэлектроники Apple опережает всех конкурентов компании, как минимум, на два года. Только и всего. Ну не жулики?

Продолжение следует, а пока обсудить историю Apple вы можете в нашем Telegram-чате.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector