<<<предыдущий список следующий>>>

Это - копия документа, находившегося на http://dz.ru. Авторские права, если не указано иначе, принадлежат Дмитрию Завалишину и/или Евгении Завалишиной. Все изменения, внесенные мной, находятся в этой рамочке.Пожалуйста, прочитайте disclaimer.


2 ноября 1998 года

Эта неделя начнется со "сладкого" - Евгений Кузнецов рассказывает о работах Бабаяна и Центра Спарк Технологий. Кстати, по приведенной им ссылке лучше сходить до прочтения этой статьи.

   
From: Eugene A. Kuznetsov
Subject: Babayan

Привет, Dmitriy!

"Кстати, описывая свою идею суперпроцессора, который будет сильнее   Мерседа, Бабаян сказал, что готов научить его исполнять мерседовский и  IA-32-шный код. Я так понимаю - путем двоичной перекомпиляции на ходу."

Вижу большой интерес к теме и решился, насколько позволяет рабочее время раскрыть ее для читателей dz-online. Лучше всего Борис Арташесович описал текущие свои планы и задачи в (люблю я это место) OSP :

http://www.osp.ru/cw/1998/03/business/05.htm

Начнем с чего-нибудь простого. Например, с того, что при пропускной способности шины в такт большей чем длина команды, RISC (Reduced Instruction Set Computer) архитектура более экономична к количеству элементов в процессоре (а чем меньше элементов, то тем легче повысить тактовую частоту), чем CISC (Common Instruction Set Computer). Один из главных отличительных признаков RISC - все команды имеют одинаковую длину. Можно взять, например, 4 команды и начать одновременно все их декодировать, начало-то каждой команды известно где. А вот в CISC это большая проблема - для того, чтобы узнать начало следующей команды надо декодировать текущую. Pentium II - billions-cost вершина достижений Intel всего лишь может выполнить две CISC команды в такт, в то время как более дешевые для разработки  UltraSPARC и Alpha могут легко выполнить четыре. Но с ростом числа одновременно выполняемых команд начинают появляться проблемы и у RISC. Проблемы связаны с тем, что часть команд таки зависят от предыдущих по регистрам, и не могут быть исполнены раньше и даже одновременно с теми, от результатов исполнения которых они зависят. И тут на выручку приходит VLIW (Very Large Instruction Set [вероятно, имелось в виду Very Long Instruction Word :) -- dz]), суть которого не в ну уж очень длинной инструкции, а в явном параллелизме, в явном указывании зависимостей между командами, процессор становится тупым как пробка, только декодирует набор команд и исполняет какие может. Освобождается большое количество элементов, которое можно использовать для функциональных устройств, плавающих там или целых, можно даже выполнять команды про запас по нескольким веткам ветвления сразу, пока не подсчитаешь по какой именно ветке надо было идти. Производительность процессора сразу взмывает на максимальную высоту при одинаковой технологии. Недостатков у VLIW, если не считать память и шину для такой архитектуры, всего два :

A - разрабатывать архитектуру с нуля, с принципов очень долго, лет эдак 7
B - разрабатывать хороший компилятор для нее лет 5

и все это при наличии хорошей команды и хороших условий. Боссы компьютерной индустрии вообщем-то осведомлены о возможностях этой архитектуры, и... уползают с рынка high-end станций. Ну невозможно за оставшееся время получить аналогичный процессор, невозможно. Merced, если позволит шина и если HP/Intel сделают все правильно, сделает все остальные процессоры по производительности легко и непринужденно. Единственное что, кроме USA DOJ, может помешать Intel стать полным монополистом в области процессоров это двоичная несовместимость с x86. Ох уж эта, двоичная несовместимость, о ней позже отдельный разговор. Ах да, компилятор еще, ну плохонькие они будут поначалу, плохонькие, хотя и пишут его сейчас всем миром.

Ну это, как говорили в старину ГБшники, дела буржуазные, что там у нас, в отечестве? Вы будете смеятся, но в 91 году у нас все это уже было, и компилятор был, и архитектура Элбрус-3. Не было всего лишь элементной базы, СССР - лидер в области химического оружия и космической промышленности, не умел делать современные микросхемы. Не умел и все тут. Не нужны баллистическим ракетам легкие управляющие схемы, там килограмм другой ничего не решает. Все-таки свободная страна выигрывает у диктаторской, потому что есть вещи, которые нельзя запланировать заранее. Сухой остаток к 91 году - разоренная страна, не способная более делать суперкомпьютеры, ну и компьютеры тоже. Борис Бабаян начал искать поддержку, и нашел ее в Sun Microsystems. Дейв Дитцел понял и возможности архитектуры и дороговизну ее разработки своими силами. Начали вырисовываться контуры SPARC-подобного процессора, но очень большое но, он не был и не мог быть двоично совместимым со SPARC архитектурой. В Sun приняли жесткое решение - время RISC архитектуры еще не прошло, и сделали ставку на UltraSPARC и Java. В МЦСТ (Московский Центр Спарк Технологий) остались патенты и люди (ну не все еще уехали, не все), способные сделать самый быстрый в мире процессор. Людей надо было кормить, работу, хотя и нет денег на рисование схем для кристалла, надо было продолжать, идеи развивать. МЦСТ продвинулся вперед, еще дальше, чем был. Был разработан, пока слабенький, двоичный компилятор, эта технология, мало у кого имеющееся, позволяет без патентов Intel'а запускать в realtime программы для x86. С ней не нужно тратить драгоценные элементы на поддержку старых режимов. Есть много лет развивающийся компилятор, написанный еще для Эльбруса. В 1997 году наша страна сделала то, что не делала очень давно. Был получен кристалл, мы сделали собственный микропроцессор, SPARC v8, 100Mhz. В нем гарантировано нет никаких закладок, нет команд позволяющих взламывать секретную систему простому такому пользователю, который имеет приработок от иностранных разведок. Мы можем заказать этот процессор фабрикам во Франции, Америке, Азии, только вот в нашей стране не можем. Нет у нас таких фабрик. Как только будут, сможем заказать и здесь. В принципе, закладку могут сделать и на фабрике, только ее, мы надеемся, можно будет обнаружить. Поскольку наше государство не может обеспечивать high technology в этой стране, приходится делать это самим, хотя это и тяжело. МЦСТ выполняет много работ и для Sun Microsystems и для других западных фирм. Покупая станции Sun у www.el2000.ru, Ельбрус-2000 это другое название фирмы, граждане нашей страны финансируют не дачи на Канарах и Кадилаки для новых русских, а вот high-technology и будущее нашей страны, такая вот грустная реклама. Грустная она потому, что после известных событий изменился инвестиционный климат на Западе, уменьшилось и без того не очень большое количество денег в государстве, которых оно может  пустить не на пенсионеров, а увеличилось только желание сильных и умных людей свалить отсюда. Ну слава богу, что Борис Арташесович пока не собрался, хотя давно мог.

Чуть-чуть о HP. Питер Розенблат в августе 1991 года сидел и слушал лекции, лекции ему рассказывало наше руководство. По улицам грохотали танки, люди у Белого Дома защищали Ельцина. А он сидел и слушал, слушал. Позже он заметил, что ощущал себя студентом, не студентом даже, а школьником, ему в США так и не поверили, что можно в СССР научиться о том, как надо делать процессоры.

С уважением,
-
Евгений.

 

Вот такая вот греющая патриотизм история. Спасибо, Евгений, очень рад был получить эту статью.

 Socket 7
Конечно, седьмому осталось жить недолго. Интел от него отвернулся, AMD подержался некоторое время и тоже вон сваливает на Slot A - думаю, что не последней причиной тут стало изменение протокола обмена процессора с системной шиной.

Однако, Socket 7 хоронить еще рано. В него совсем скоро можно будет воткнуть AMD K6-3 aka Sharptooth - процессор с L2 кешом на борту (256К), работающим на частоте процессора, которая, кстати, обещает достичь 450 МГц. Нижней границей, видимо, будет 350 МГц. Оптимисты предполагают, что K6-3 сможет посоревноваться даже с PII той же частоты и выиграть.

Альфа, видимо, даже в гробу не будет давать покоя Intel-у. Дело в том, что Dirk Meyer, человек, участвовавший в ее создании, теперь трудится на AMD. Это многое объясняет. И то, что К7 будет базироваться на Альфовском шинном протоколе, и то, что архитектура ядра процессора претерпела весьма серьезные изменения, и то, что, в кои то веки, AMD собирается задать шороху не только по целочисленной арифметике, но и по плавающей точке.

Вообще, насколько это можно понять на сегодня, К7 - довольно интересный процессор. Будет. Наверное. :-) Дело в том, что он заявлен как чип седьмого поколения, стоящий на шаг дальше пентиума два и даже ксеона.

Здесь уместны следующие вопросы. Первый - это что вообще будет с рынком после выхода Мерседа. Будет ли Интел вытаскивать всех на Мерсед или же это будут две отдельных войны - Мерсед против... против кого, кстати? Будем надеяться, что найдется, против кого. Например, дайте помечтать, против Эльбруса. Так вот, Мерсед против Эльбруса и линия IA-32 против AMD K???. В таком случае AMD потребуется хорошее присутствие на этой линии, а на войну с Мерседом можно плюнуть - это дорого и не есть массовый рынок.

Другое дело, если Интел-таки решит убить IA-32 и сделать пост-мерсед мейнстримом. Это будет тяжело сделать, но еще тяжелее станет конкурентам, если, все же, такое случится.

На сегодня в пользу линии "все на Мерсед" (точнее, все - на IA-64) говорит лишь один факт. Но существенный. Intel заморачивается с прогоном на Мерседе 32-битного (x86-го) кода. Это настолько геморройное занятие, что трудно предположить, что оно - со скуки. Правда, с третьей стороны, Intel всегда отличался умением заботиться не только о том, что безусловно нужно, но и о том, что может пригодиться. Стелил соломку-то.

Кстати, стелит соломку и AMD. Что-то там в ответ на Мерсед у них зреет в пузе. Что - пока не знаю.

Ну да вернемся к К7. Кратко по фактам.

 Overclock
Как получается, что процессор маркирован на 266 МГц, а работает, например,  на 333? Специалисты из AMD объясняют это тем, что из всей "вафли", содержащей десятки кристаллов процессоров, на быстродействие тестируются лишь несколько, и вся вафля маркируется по минимальной частоте, которую выдержали при тесте эти процессора. Вполне возможно (и так и случается), что другие кристаллы окажутся менее требовательны и заработают на большей частоте.

Шина - до 200 МГц. Это существенно, и, как ни странно, из всех ближайших процессоров только К7, вероятно, сможет дать полную нагрузку памяти в стандарте Direct RDRAM. Это весьма существенно - сегодняшние процессоры зажаты более шиной, чем тактовой частотой, и без повышения скорости шины жить просто нельзя. Это понимают все, и делают все. Но 200 МГц - сильная заявка. Кстати, утверждается, что опытные образцы самого процессора бегают уже на 500 МГц, так что шустрая шина нужна ему буквально как воздух.

Кеш - 128К (64I+64D) L1. Что же касается L2, то он, видимо, будет внешним по отношению к кристаллу процессора. Встроенная Tag-память на кристалле поддерживает до 512К кеша L2, но можно будет добавлять внешнюю и доводить его объем до восьми мегабайт. Что касается рабочей частоты кеша, то ее можно будет варьировать от 1/3 до полной частоты ядра. Все это в совокупности позволит выпускать множество моделей процессора, сильно различающихся по цене и стоимости.

Но все это не так интересно. Интересны две вещи - архитектура процессора и новая шина. На сегодня, пожалуй, хватит, а на днях я постараюсь вернуться к этим темам, и заняться ими поближе.

Кстати.

На вопрос о конкуренции между 3DNow! и KNI aka MMX2 представители AMD обратили внимание на тот факт, что KNI изначально выйдет в составе Katmai, а это - весьма недешевый процессор, а значит до проникновения KNI на массовый рынок еще немало времени. Это, при учете того, что около восьми месяцев преимущества до выхода Katmai у 3DNow! есть внушает AMD некоторый оптимизм.

С другой стороны, очевидно, что KNI потребует ответа от AMD и, вероятно, 3DNow будет дорабатываться, чтобы догнать/обогнать Intel на этом фронте. Однако, не раньше, чем Katmai будет реально доступен.

MyVcard - любопытный сервис, облегчающий обмен "визитками" в сети. Вместо того, чтобы слать всем свою контактную информацию, ее можно положить на сайт и раздавать пароль на доступ к ней. Плюсов два - во-первых, пароль можно сказать и по телефону, гарантировав себя, таким образом, от ошибок, столь нередких при передаче адреса голосом, и, во-вторых, MyVcard умеет запоминать, кто запрашивал информацию и рассылать им, при необходимости, уведомления об изменениях. Это представляется довольно ценным.

Чтобы зарегистрироваться на этой системе необходимо просто ввести свой e-mail, не указывая никакого пароля.

Vadim Tubelsky прислал еще пару замечательных доменов в .de - http://www.tema.de и
http://www.design.de :-).

По просьбе благодарных клиентов (оказывается, среди моих читателей их, минимум, двое) передаю публично их рекомендации компании "Фольком", которая торгует в России книгами таких знаменитых издательств как Prentice Hall, Macmillan Computer Publishing, Macmillan Press, O'Reilly, Addison Wesley, SAMS, QUE и многих других.

Так что кому нужно что-либо из англоязычных книг - попробуйте (095) 251-4504, говорят - хорошо.

Прочитал тут у Алгоритма, что в Питере возбуждено антимонопольное дело... нет, нет, не против Микрософта. Они соригинальничали - против компании <Санкт-Петербургские таксофоны>.

:-)