Железные достопримечательности
Авторы: Сергей Цыпцын, Берто, Паоло
Производителей железа на выставке традиционно было немного. Они благополучно сбегают на более «тяжелые» выставки NAB в Лас-Вегасе и IBC в Амстердаме. Впрочем, сверхагрессивно настроенная AMD в компании с благополучно приобретенной ATI отгрохала шикарный кобальтовый стенд, на котором на станциях Hewlett-Packard стремительно крутились многочисленные приложения из разных областей индустрии. AMD явно придерживает в рукаве некоторые козыри, разработанные уже после покупки ATI, и не торопится делать вызывающие заявления. Среди прочих экспонатов процессорного гиганта меня сильно впечатлила желтенькая книженция «Мультиядерность для Чайников» («Multi-Core Processing for Dummies»). Прихватил в собой, регулярно почитываю, полезная вещь.
Стенд nVidia был усеян серыми гробиками – супервидеоускорителями Quadro Plex. Это внешние видеокарты нереальной производительности и такой же нереальной цены. Они призваны не только крутить миллиарды полигонов на экране, но и ускорять вычисления в различных программах, разгружая центральный процессор и перекладывая часть вычислений на графический процессор (GPU). Апофеозом такого ускорения стала демонстрировавшаяся на стенде связка Quadro Plex и nVidia Gelato 3.0, пакета для рендеринга трехмерных сцен с полной поддержкой ускорения расчетов на GPU (от nVidia, разумеется). На сцене средней тяжести ambient occlusion рассчитывался в течение одной (!) секунды. Стоявший рядом со мной Алексей Kidd Пузиков, автор легендарной программы Shaderman, чуть не упал в обморок от таких результатов и долго потом недоверчиво мотал головой.
Впрочем, nVidia решила пойти еще дальше. Если видеокарта способна так ловко ускорять расчеты, то зачем ей «видео»? Незачем, решили разработчики nVidia и выпустили графический процессор Tesla, который ничего на экран не выводит, а лишь ускоряет расчеты. Это карта PCI Express, на борту которой находится один или два Tesla GPU.
Такой GPU содержит 128 параллельных процессоров и должен обеспечивать производительность в половину терафлопса. Карт с Tesla GPU можно запихнуть в компьютер несколько штук, разогнав производительность до 8 терафлопс.
Спираль эволюции сделала очередной виток. Помните карты от ARTVPS, напичканные специализированными процессорами, которые только ускоряли рейтрейсинг и больше ничего не делали. (Кстати, карты Pure и рендерер RendeDrive от ARTVPS еще живы и называются теперь AR500 и RayBox соответственно. И даже продаются по цене 8300 долларов.) Конечно, в решениях от nVidia прослеживается определенная прагматичная последовательность: вы покупаете ускоритель вычислений (младшая модель Tesla CPU Computing Processor стоит полторы тысячи долларов), затем, если вы не разработчик, а скромный труженик cg-индустрии, вы должны прикупить еще продукты от nVidia, поддерживающие этот ускоритель, – например, рендерер Gelato, действительно интересный, быстрый, но и не дешевый, 1500 долларов. Он умеет обрабатывать сцены из Maya, 3ds max и других трехмерных пакетов. Таким образом, ситуация сильно напоминает ситуацию конца прошлого века с картами ARTVPS. Конечно, если вы разработчик, вы можете воспользоваться инструментарием CUDA от nVidia, позволяющим перекомпилировать ваши программы для использования всей мощи графических процессоров в расчетах произвольного типа. Это, бесспорно, гораздо более гибкий подход, но достаточно жестко привязанный к решениям от nVidia.
Если в позапрошлом году Сигграф сходил с ума от ускорения рендеринга на GPU, в прошлом – от ускорения физики (в основном для игр) с использованием видеокарт, то в этом году дискуссии наконец-то вышли на более абстрактный уровень обсуждения GPGPU (General Purpose GPU) – графических процессоров общего назначения. Столь модная еще год назад игровая физика начисто исчезла со стендов.
Приложения, задействующие GPU, пошли «вширь». Среди них на стенде nVidia был замечен mental mill от компании mental images, интерактивная среда разработки материалов, причем не только для системы mental ray (как следовало бы ожидать), но и с возможностью экспорта результата в различные языки описания шейдеров – HLSL, GLSL, Cg FX, MetaSL. Удивительной особенностью mental mill является то, что все иконки-ноды, традиционно обозначаемые условными значками, представлены здесь как мини-openGL-окна, внутри которых можно видеть промежуточный или финальный результат (трехмерную картинку) без всякого просчета, прямо в реальном времени. В окошках можно панорамироваться, приближаться, крутить камеру, как в обычных трехмерных пакетах. Есть даже заготовка материала для воды в виде мини-пляжа с набегающей на берег волной. Кстати, mental mill был впервые показан в апреле в Москве на конференции CGEVENT и вызвал, помнится, большой фурор. По заявлению производителя, работает эта радость пока лишь на картах Quadro FX 3400 и выше, но время покажет, сумеют ли пользователи приспособить это решение к более демократичным устройствам.
Меня давно занимала мысль о том, когда, наконец, процессор Cell пойдет в широкие массы. На околице выставки мною была обнаружена компания Mercury Computer Systems, предлагающая населению карту PCI Express, на которой размещено некоторое количество процессоров Cell. Карту сию следует вставить в обычный PC и наслаждаться преимуществами новой процессорной архитектуры. Чтобы оприходовать магическую мощь Cell, надо иметь программы, которые умеют этот процессор использовать. Дабы перекомпилировать свои шедевры под Cell, компания Mercury предоставляет специальный MultiCore Plus SDK, который может быть использован с коммерческими компиляторами от IBM либо с неким бесплатным компилятором под Linux. Никакой Microsoft Visual/Net не поддерживается, ибо работает все это хозяйство только под Linux. На стенде работали сертифицированные Mercury «писюки» в лице HP+AMD+Cell-карта; на них, к сожалению, крутились уже набившие оскомину двадцать четыре окна-плеера, одновременно и плавно декодирующие двадцать четыре потока видео в формате H.264. По словам разработчиков, сертификация условная и желающие могут попытаться собрать Linux-машину из любых доступных компонентов. Стоит Cell-карта с программной обвязкой 8000 долларов. В ответ на мои слова о том, что за такие деньги я могу собрать много (например, двадцать) изрядно мощных компьютеров (без всяких мониторов, дисков и видеокарт), стендовые инженеры не моргнув глазом заявили, что ожидают ускорения приложений в сорок раз.
Шумиха вокруг Cell подогревалась заявлениями некоторых компаний о портировании своих приложений под Cell-архитектуру. И если до Сигграфа я благополучно игнорировал громкие маркетинговые пресс-релизы компаний, не относящихся к миру «тяжелой» графики, то обещания mental images и Side Effects (!) портировать свои приложения на так называемый Cell Computing Board от Sony заставили меня срочно нырнуть в Интернет. Одно только сочетание "Houdini для Cell" отдает сильнейшей интригой для всей индустрии компьютерной графики.
Смущает, правда, что компании планируют показать первые результаты во второй (!) половине будущего года. Для заявлений, сделанных в экзальтированной индустрии компьютерной графики, это может означать "никогда".
Подытожить дискуссии о специальных ускорителях вычислений можно, упомянув находящийся в разработке процессор Larrabee от компании Intel, традиционно не участвующей в Сигграфе. Похоже, Intel собирается одним выстрелом убить целую популяцию зайцев. И под обстрел попадут не только nVidia, ATI, AMD, но и многие другие. Производительность 1 терафлопс, до 48 ядер на процессоре, графические ядра и пр. По слухам, этот монстр может вначале появиться как графический ускоритель на плате PCI Express 2, и вот тогда расстановка сил на рынке графических (и не только графических) ускорителей может сильно измениться. Но не раньше 2009 года.