Войти
ФлеймФорумПроЭкты

❌80: Тёплый ламповый (11 стр)

Advanced: Тема повышенной сложности или важная.

Страницы: 110 11 12 1319 Следующая »
#150
(Правка: 15:08) 14:52, 11 июня 2018

=A=L=X=
> Интересно какие там скорости получаются без всяких конвееров и кешей...

STM32F303VC (от 200 до 500 рублей за чип в розницу, в зависимости от комплектации)
Core: ARM® Cortex® -M4 32-bit CPU with FPU (72 MHz max), single-cycle multiplication and HW division, 90 DMIPS (from CCM), DSP instruction and MPU (memory protection unit)
Memories
- 128 to 256 Kbytes of Flash memory
- Up to 40 Kbytes of SRAM, with HW parity check implemented on the first 16 Kbytes.
- Routine booster: 8 Kbytes of SRAM on instruction and data bus, with HW parity check (CCM)

Надо ещё проще? Не вопрос.
ATmega8 (около 100 рублей за чип в розницу)
A monitoring and protection circuit for 1-cell and 2-cell Li-ion applications that require <...> low cost, and high utilization of the cell energy.
The microcontroller includes 8KB self-programming flash program memory, 512-Bytes SRAM, 256-Bytes EEPROM <...> It also supports up to 4 MIPS throughput at 4MHz.
И, между прочим, оба в качестве основного компилятора используют gcc, и как побочный эффект - вполне программируются на крестах.

Слишком просто? Ну окей, давайте глянем в другую сторону.
(3300 рублей в местном магазине) The Raspberry Pi 2 V1.2 was upgraded to a Broadcom BCM2837 SoC with a 1.2 GHz 64-bit quad-core ARM Cortex-A53 processor, the same SoC which is used on the Raspberry Pi 3, but underclocked (by default) to the same 900 MHz CPU clock speed as the V1.1.

Правда, ARM Cortex-A53 уже слишком быстрый, чтобы работать без кэша и конвеера, так что, наверно, уже не пойдёт.
Можно ещё в видеокартах ядра посмотреть - память вовсю кэшируется, зато ядра упростили настолько, что на несколько сотен ALU приходится только одна управляющая схема.

Alikberov
> Зачем экономить?
Чтобы можно было наспамить больше ядер за те же деньги/площадь/энергопотребление.


#151
(Правка: 15:09) 15:09, 11 июня 2018

Delfigamer
> Чтобы можно было наспамить больше ядер за те же
> деньги/площадь/энергопотребление.
Ужe говорил я выше, что на конвейер моих знаний не хватит. Тем самым, я как бы снимаю с себя бремя ответственности за реализацию многоядерного x80на данный момент.
Мне просто надо собственный процессор запустить на Орбиту, вывести дамп памяти голограммой над СШП и благополучно сгореть в атмосфере :))
Продавать собственные x80-приставки, конкурирующие с XboX я не планирую.

#152
(Правка: 15:14) 15:13, 11 июня 2018

Delfigamer
> Надо ещё проще?

Да, проще, желательно 8/16 бит без конвеера, кеша и всяких прочих оптимизаций рассчитанных как раз на низкую скорость обмена данными с памятью, что присуще всему современному зоопарку. То есть идея в том, что с локальной SRAM по схеме кеша все эти бустеры уже вроде и не нужны совсем. Можно давить на простоту остальной схемы.

> ATmega8

Вроде оно, но смущает что программа же хранится во flash, а у неё скорость работы ведь вроде ниже чем SRAM на чипе. Как бы без "routine booster" не очень доверие к числам.

#153
(Правка: 15:55) 15:55, 11 июня 2018

=A=L=X=
> Вроде оно, но смущает что программа же хранится во flash, а у неё скорость
> работы ведь вроде ниже чем SRAM на чипе.
А разница, если инструкции по 2 байта и читаются максимум на 16 МГц?

=A=L=X=
> без конвеера, кеша и всяких прочих оптимизаций рассчитанных как раз на низкую
> скорость обмена данными с памятью
Вот, кстати, что считать "конвеером"? Так-то и на AVR8 есть почти что конвеер:

+ Показать

И на ARM Cortex-M4, судя по описанию - тоже одноуровневая адресация, но уже 3-стадийный конвеер.
Вообще, конвеер нужен не затем, чтобы сэкономить на работе с памятью - для этого применяется кэш; а для того, чтобы уменьшить длину пути сигнала, который проходится за один такт - что, при фиксированном времени переходного процесса транзистора, позволяет уменьшить длительность одного такта и тем самым увеличить пропускную способность ядра.
#154
17:59, 11 июня 2018

Delfigamer
> Вообще, конвеер нужен не затем, чтобы сэкономить на работе с памятью

Конвеер может убегать вперед паровоза и тем самым тоже снижать зависимость от низкой латентности памяти, так что он тоже в эту кассу попадает.

#155
18:19, 11 июня 2018

=A=L=X=
> Конвеер может убегать вперед паровоза
это делают всякие там схемы предвыборки/предсказания.

> Размеры кристаллов с лёгкостью вместят сотни килобайт и так стопудово делают.
только стоят они доллары. а всякие контроллеры где памяти кот наплакал (холтек, самсунги есть восьмибитные, stm8 всякие урезанные) - те в массовых партиях стоят центы.

#156
(Правка: 18:34) 18:33, 11 июня 2018

Mahagam
> это делают всякие там схемы предвыборки/предсказания.
ну так они же - часть конвеера.

Mahagam
> только стоят они доллары
да я уже давно сомневаюсь, что размер самого типового одноцентового кристалла в современности не может вместить 128 Кб SRAM до кучи с 32-битным процессором
просто сегментация рынка, всякие легаси и прочие "здесь так принято".

#157
19:51, 11 июня 2018

=A=L=X=
> Конвеер может убегать вперед паровоза и тем самым тоже снижать зависимость от
> низкой латентности памяти, так что он тоже в эту кассу попадает.

это тебя PPC покусал ?

может конвеер и бегает впереди чего там, но основной поинт, что делает несколько операций на разных стадиях раз 1 такт

#158
21:38, 11 июня 2018

innuendo
Конвеер по своей природе работает на опережение вычислительных блоков процессора, то есть совершает упреждающие выборки из памяти, чем в том числе скрадывает ее медленность. Я не говорил что это его основная функция, но все это вместе с выборками линиями кеша завязано в тугой узел вокруг узкого звена долгого отклика памяти.


Вопрос же вообще был в том, чтобы взять классический дизайн например z80, но реализовать весь компьютер на кристалле в миллиметр чтобы озу было sram-ом скорости кеша и посмотреть как без всех этих ухищрений современности вырастет производительность.

#159
22:09, 11 июня 2018

=A=L=X=

ok, как ты думаешь, отчего RISC так удачно пошли на всяких убогих железках типа телефонов и тд ? ARM какое место занимает в телефонах ?

#160
22:49, 11 июня 2018

=A=L=X=
> Конвеер по своей природе работает на опережение вычислительных блоков
> процессора
совершенно неверно

> и посмотреть как без всех этих ухищрений современности вырастет
> производительность.
ну получим прирост в 20 раз как по частоте так и по производительности. с учётом 4-7 тактов на команду - пшик, по современным меркам.

#161
(Правка: 0:09) 0:07, 12 июня 2018

=A=L=X=
> то есть совершает упреждающие выборки из памяти,

погоди, весь смысл кэша в ...

в моих эротических фантазиях есть RISC типа zero level, где нету даже mul/div - всё самое простое, а потом уже можно делать на его основе всякие навороченные

#162
0:14, 12 июня 2018

Mahagam
А что мешает сделать один такт на команду?
Для 8051 однотактовое ядро уже все кому не лень было зарелизили.

#163
0:21, 12 июня 2018

Tonal
> А что мешает сделать один такт на команду?
ничего, разве что частоту не поднимешь так высоко, как её можно задрать на многотактном проце

#164
0:32, 12 июня 2018

Mahagam
Само собой, но пару сотен мегагерц потянет.

Страницы: 110 11 12 1319 Следующая »
ФлеймФорумПроЭкты