sexta-feira, 4 de fevereiro de 2011

3.6.2 Processadores Cyrix

Sobre a Cyrix não vamos falar muito, dado que o seu peso é bastante menor comparado com o dos seus antagonistas, além de que actualmente não entra na competição dos CPU para PC.

A Cyrix teve o seu ponto alto com o M1 (6x86 e 6x86MX) e o M2. O M1 era um processador de 3,3 milhões de transístores e foi inicialmente fabricado com tecnologia de 0,65u. O 6x86 tinha duas pipelines internas e uma cache interna unificada de 16 KB. Oferecia execução especulativa e instruções fora de ordem, tal como o Pentium Pro da Intel. O 6x86MX acrescenta tecnologia MMX ao 6x86, é compatível com socket 7, no entanto, algumas versões requeriam chipsets modificados e desenhos diferentes de motherboards.

O M2 tem 64 KB de cache L1 unificada e mais do dobro da performance do 6x86, fabricado com tecnologia 0,25u e 6,5 milhões de transístores. O M2 é oferecido em velocidades de relógio que vão desde os 180 MHz aos 225 MHz e, tal como no M1, o M2 também é compatível com socket 7.

3.6.1.8 Athlon 64 X2

Muito semelhante ao Athlon 64 FX, a principal diferença deste processador é ter totalmente um processador com dois núcleos, mantendo as restantes características e tecnologias.

3.6.1.7 Athlon 64 FX

Este processador da AMD funciona já a 64 bits e vem equipado com arquitectura Single-Core ou Dual-Core e cache L2 de 1 MB, ou duas caches L1 de 64 KB cada.

Já vem com suporte para memória DDR até 200MHz e utiliza o sistema Hyper-transport Technology da AMD com uma ligação a 16 bits. Suporta velocidades até 800 mhZ numa direcção ou 3,2 gb/seg. em cada direcção.

3.6.1.6 Duron

O Duron foi lançado no Verão de 2000 com o nome de código “Spitfire”. O seu mercado é o dos computadores caseiros e por isso concorrente directo do Intel Celeron.

O Duron é um Athlon, mas com um novo desenho nomeadamente, cache L2 de 64 KB no chip, cache L1 de 128 KB também no chip, socket A, frequências entre 600MHz e 950 MHz.

O Duron é o primeiro processador a ter uma cache interna L2 mais pequena do que a cache L1.

Outra das suas características é ter um desenho exclusivo de cache que faz com que nunca se encontre os mesmos dados na cache L1 e na cache L2, fazendo aumentar a eficiência da cache.

Com a introdução do Duron, passou a ter-se acesso a uma tecnologia encontrada em processadores de gama superior, mas a um preço muito mais acessível. Algumas das suas características mais inovadoras incluem:

  • Um barramento de sistema da alta velocidade, mais concretamente, um Front Side Bus a 200 MHz.

  • Arquitectura de cache sofisticada. O Duron tem um total de 192 KB de cache interna, isso combinado com o seu desenho exclusivo dá-lhe uma performance superior em relação ao seu concorrente Celeron.

  • Unidade superescalar de vírgula flutuante com tecnologia 3DNow.

3.6.1.5 Athlon

O AMD Athlon, ou K7, representa o primeiro processador da sétima geração, foi lançado em Agosto de 1999 e foi desenhado usando tecnologias dos processadores RISC DEC Alpha e 2162.

Este processador representa a mais espectacular mudança nos processadores da AMD. Neste processador, a AMD cortou as compatibilidades com os processadores da Intel, utilizando inclusivamente um barramento completamente diferente dos utilizados pelo Pentium III. A ligação do processador à placa é feita através do slot A, o qual tem a mesma configuração do slot 1 da Intel, sendo mesmo compatível mecanicamente, embora o mesmo não aconteça a nível eléctrico, que é o mesmo que dizermos que se colocarmos um K7 numa placa com slot 1, ele não funcionará, e vice-versa (fig. 3.51).

Fig. 3.51 – O K7 Athlon numa placa com slot A

Vejamos então o que nos pode oferecer o Athlon:

ü Montagem tipo Pentium II, mas desenho totalmente AMD, no socket denominado slot A (fig. 3.52).

ü Velocidade de relógio de 500 MHz nas primeiras versões.

ü Até 8 MB de cache L2, mínimo de 512 KB.

ü 128 KB de cache L1.

ü 22 milhões de transístores.

ü Um novo sistema de barramento de 200MHz e 266 MHz.

ü Backside bus independente que liga a cache L2 ao CPU. Aqui a velocidade de relógio pode ser de ¼, 1/3, 2/5 ou igual à frequência interna do processador.

Fig. 3.51 – O K7 Athlon numa placa com slot A

Como o Athlon não usa o mesmo slot nem as mesmas placas que o Intel Pentium II e Pentium III, a AMD não pôde desenvolver uma arquitectura totalmente nova. Isto quer dizer que na realidade não existe um barramento de sistema. O módulo do Athlon é ligado directamente ao “North Bridge” do chipset, sendo nas primeiras edições essa ligação feita através de um canal de dados a 200MHz.

Esse canal liga somente duas unidades: o CPU e o chipset. No caso dos sistemas P6, o CPU, a cache L2, a RAM, as unidades PCI, a unidade AGP e o chipset estão todos ligados ao barramento de sistema. No Athlon o tráfego é dividido: primeiro, vem a “North Bridge” e, depois, a RAM, o AGP, a “South Bridge” e as unidades PCI.

Ao eliminar o barramento de sistema e substituindo-o por este novo sistema, o Athlon passa a ter uma largura de banda muito maior. Teoricamente, a largura de banda numa ligação a 200MHz será de :

200,000,000 x 64 bit/ bit/ segundo = 1,6 GB/seg

O que é significativamente melhor do que os seus concorrentes Intel, nomeadamente os Intel a 100MHz, que têm um máximo de 800 MB/seg., e o Intel 133 MHz que alcança 1064 MB/seg..

Em Junho de 2000, a AMD lançou a partir da sua fábrica de Dresden, na Alemanha, um novo processador Athlon, com o nome de código “Thunderbird”. Os primeiros Thunderbirds têm entre as suas características:

  • Velocidade de relógio entre 750 MHz e 1 GHz, com tecnologia 0,18u em cobre.
  • Cache L2 integrada de 256 KB.

  • Um novo socket A de 462 pinos.

  • Disponibilidade de chips tanto em cobre como alumínio.

Com os seus 37 milhões de transístores, o Athlon Thunderbird compete directamente com o Pentium III “Cumine2. O velho desenho do Athlon com desenho de cartridge em slot A tinha uma fraca performance em relação à cache L2. Os 512 KB de cache L2 estão, tal como os Pentium II, colocados fora do chip do processador, fazendo com que a ligação ao processador trabalhe somente a metade ou um terço da velocidade do mesmo.

Integrando a cache L2 no interior do processador, os 256 KB são acedidos à mesma velocidade de processamento do CPU, fazendo com que a diferença de tamanho de cache seja completamente irrelevante.

No entanto, o Pentium III Cumine continua a ter uma grande vantagem em relação ao Athlon, no que respeita à cache L2. Quando a Intel decidiu integrar os 256 KB de cache L2 no interior do CPU, fê-lo através de um barramento com 256 bits de largura.Se a cache for exterior ao processador, fica-se limitado a um barramento de 64 bits de largura entre o CPU e a cache, isto por causa do número de pinos do CPU que se pode utilizar para ligação à cache. No caso de a cache L2 estar colocada no interior do CPU, não há necessidade de obedecer a esta limitação. No entanto, e ao contrário do que fez a Intel, a AMD continuou a fazê-lo, por isso, o núcleo do Thunderbird continua a ser ligado à cache L2 através de um barramento de 64 bits.

Vamos agora ver uma tabela comparativa de algumas das características do Athlon e dos seus concorrentes da Intel (tabela 3.22).

Característica

AMD Athlon

Intel Pentium III

Intel Pentium 4

Operações por Ciclo de Relógio

9

5

9

Pipelines de Inteiros

3

2

3

Pipelines de FPU

3

1

3

Descodificadores x86

3

1

3

Cache L1

128 KB

32 KB

128 KB

Cache L2

256 KB internos

256 KB internos ou 512 externos

256 KB internos

Barramento de Sistema

200 MHz a 266 MHz

100 MHz ou 133 MHz

400 MHz

Instruções 3D

3DNow

SSE

SSE2

Tabela 3.22 – Características do Athlon em comparação com os processadores Intel

3.6.1.4 K6-III

Lançado no verão de 1999, o K6-III incorpora também a tecnologia 3DNow, assim como a cache de três níveis. No k6-III podemos encontrar:

  • Uma unidade K6-2 melhorada.

  • Cache L2 interna de 256 KB.

  • Desenho de cache de três níveis.

  • Novo Front Side Bus de 133 MHz.

  • Velocidades de relógio de 400 MHz e 450MHz.

Tanto a cache L1 de 64 KB, como a L2 de 256 KB, estão integradas no interior do chip e isso faz com que a cache L2 trabalhe à mesma velocidade que o processador. Dado que o K6-III, tal como o K6-2, foi feito para trabalhar numa motherboard super 7, isso permite-lhe ter também uma cache L3 na motherboard que poderá ir até 2 MB, o que quer dizer que no toal podemos ter um máximo de 2.368 KB de memória cache.

No entanto, e apesar de toda a performance que o K6-III nos pode dar, ele, com os outros processadores da AMD, tem um handicap em relação aos seus equivalentes Intel, a unidade FPU ou Floating Point Unit. À mesma frequência de relógio, a sua performance é de cerca de 40% da de um Pentium III. No entanto, com a tecnologia 3DNow, a qual é suportada pelo DirectX da Microsoft, essa diferença diminui para cerca de 15%.

3.6.1.3 K6-2

O K6-2 é o primeiro processador para socket 7 a oferecer um barramento de 100MHz, permitindo assim acelerar a transferência de dados entre o processador e o resto do sistema.

Além de um Front Side Bus de 100 MHz, o K6-2 tem o MMX melhorado em relação ao original K6. Além disso, também é fabricado utilizando a tecnologia 0,25u e 21,3 milhões de transístores.

O K6-2 tem também um desenho de cache de três níveis: uma cache L1 de 64 KB, uma cache L2 de 256 KB, funcionando ambas à mesma velocidade do processador, e um Front Side Bus de 100MHz para uma cache L3 opcional que, a existir, reside na motherboard.

Outra das características do K6-2 é a tecnologia 3DNow. Esta tecnologia é a primeira inovação à arquitectura x86, que aumenta significativamente a performance de aplicações multimédia e gráficos 3D. Esta tecnologia consiste em 21 novas instruções que podem ser usadas por empresas que desenvolvem software, de modo a dar uma melhor performance em gráficos e jogos 3D.

Nem todos os processadores da gama K6-2 funcionam a 100MHz e na tabela 3.21 podemos ver a gama K6-2, sua velocidade de barramento e factor multiplicativo.

CPU

Relógio Interno

Relógio Externo

Factor Multiplicativo

K6-2/266

266 MHz

66 MHz

4 x

K6-2/266

266 MHz

88 MHz

3 x

K6-2/300

300 MHz

100 MHz

3 x

K6-2/333

333 MHz

95 MHz

3,5 x

K6-2/350

350 MHz

100 MHz

3,5 x

K6-2/380

380 MHz

95 MHz

4 x

K6-2/400

4000 MHz

100 MHz

4 x

Tabela 3.21 – Características do K6-2

3.6.1.2 K6

O processador K6, lançado pela AMD em Abril de 1997, marcou um momento histórico na evolução dos PC. Pela primeira vez desde o aparecimento dos PC, o PC mais rápido do mundo não tinha no seu interior um processador da Intel, embora isso tenha acontecido apenas por alguns dias. Poucos dias depois, a Intel lança no mercado o Pentium II, sensivelmente mais veloz do que os seus antecessores. O processador Pentium II fez com que o K6 voltasse novamente ao seu lugar. De qualquer forma, a AMD provocou uma reacção salutar num mercado detido quase completamente pela Intel, fazendo com que esta baixasse em quase 40% os preços dos seus modelos mais populares.

Vejamos agora algumas das características do AMD K6:

· Cache L1 de 64 KB, dividida tal como nos Intel em cache de dados e cache de código, só que neste caso são duas caches de 32 KB.

· Tecnologia 0,25u.

· Núcleo RISC com descodificador CISC.

· Descodificador CISC/RISC que consegue descodificar até duas instruções por impulso de relógio.

· Conjunto de instruções MMX, compatível com o MMX da Intel.

· Compatível com socket 7.

· Alimentação a 2,9 volts, com excepção do K6-233 que deve ser alimentado a 3,2 volts.

Os modelos do AMD K6 podem ser vistos na tabela 3.20.

CPU

Relógio Interno

Relógio Externo

Factor Multiplicativo

K6-166

166 MHz

66 MHz

2,5 x

K6-200

200 MHz

66 MHz

3 x

K6-233

233 MHz

66 MHz

3,5 x

K6-266

266 MHz

66 MHz

4 x

K6-300

300 MHz

66 MHz

4,5 x

K6-333

333 MHz

66 MHz

5 x

K6-366

366 MHz

66 MHz

5,5 x

Tabela 3.20 – Características do K6

3.6.1.1 K5

O K5 é uma cópia do PENTIUM clássico. O velho K5 era denominado com PR133, isso queria dizer que tinha a performance do PENTIUM 133. No entanto, internamente trabalhava a 100 MHz, mas tinha de ser instalado e configurado como um 133. Além do 133, a AMD lançou também o PR166 que, como o seu nome indica, competia com o Intel P166.

Para conseguir ter performances idênticas aos seus oponentes da Intel, apesar de internamente funcionarem a velocidades inferiores, a AMD desenvolveu uma cache optimizada além de outras características técnicas mais desenvolvidas nos processadores Intel. A única coisa em que a AMD não conseguiu passar a Intel foi na unidade de vírgula flutuante ou coprocessador aritmético.

Vamos ver na tabela3.19 os modelos AMD K5.

CPU

Relógio Interno

Relógio Externo

Factor Multiplicativo

5K86-PR75

75 MHz

50 MHz

1,5 x

5K86-PR90

90 MHz

60 MHz

1,5 x

5K86-PR100

66 MHz

100 MHz

1,5 x

5K86-PR120

90 MHz

60 MHz

1,5 x

5K86-PR133

100 MHz

66 MHz

1,5 x

5K86-PR166

116,66 MHz

66 MHz

1,75 x

Tabela 3.19 – Características do K5

3.6.1 Processadores AMD

A AMD (Advanced Micro Devices) tornou-se no maior concorrente da Intel no campo dos processadores. Essa concorrência tornou-se mais notória nos processadores tipo Pentium, dos quais vamos ver algumas características resumidas.

3.6 Processadores Compatíveis Intel

Algumas empresas, principalmente a AMD, desenvolveram processadores compatíveis com os processadores Intel. Estes processadores têm uma compatibilidade completa, isto é, emulam todas as instruções dos processadores Intel. Alguns desses processadores são, inclusivamente , compatíveis a nível de pinos, o que quer dizer que podem ser usados em qualquer sistema desenhado para processadores Intel. Outros necessitam de motherboards específicas. Qualquer software ou hardware que trabalhe com processadores Intel trabalhará com estes processadores. Vejamos agora um resumo das características de alguns deles.

3.5.8.17 Intel Quad-Core

Com o nome de código Kentsfield, a Intel está a preparar o lançamento de um processador com quatro núcleos, no momento em que são escritas estas linhas.

Segundo a Intel, o mesmo terá uma cache unificada de 8 MB e, embora tenha mais núcleos, espera-se uma redução no aquecimento do processador.

Desde que os sistemas operativos – no caso, o Windows Vista - , tenham suporte para quatro núcleos e o restante software o permita ( a exemplo dos jogos – o software mais interessante e exigente), estamos perante um fantástico processador.

3.5.8.16 Itanium

O Itanium (inicialmente denominado com o nome de código Merced) é o primeiro numa família de processadores baseada na arquitectura Itanium e foi desenhado de acordo com as necessidades dos servidores e estações de trabalho de alto desempenho. A arquitectura Itanium ultrapassa as arquitecturas RISC e CISC, pondo a par recursos de processamento maciço com compiladores inteligentes que permitem execução paralela explícita ao processador. Os seus grandes recursos internos permitem uma optimização das aplicações a correr em Windows Advanced Server, Windows XP edição de 64 bits, assim como outros sistemas operativos, como o Linux.

O processador Itanium foi desenhado para suportar sistemas de grande escala, incluindo sistemas com dezenas de processadores, para providenciar o poder e a performance necessários a grandes servidores, servidores Internet e outros (fig. 3.47).

Vejamos agora algumas das suas características:

Ø Hardware baseado em arquitectura Itanium para alta performance:

· Quinze unidades de execução.

· Sugestões à cache para as caches L1, L2 e L3, de modo a reduzir os tempos de memória.

· 256 registos gerais e de vírgula flutuante.

· Motor de pilha de registos para uma gestão efectiva dos recursos do processador.

· Suporte para “predication” e “speculation”.

· Cache L3 de 2 MB ou 4 MB.

· Caches L2 e L2 no chip.

Ø Barramento de sistema de banda larga para escalabilidade multiprocessador:

· Largura de banda de 2,1 GB/seg.

· Barramento de sistema de 64 bits:

- Endereçamento de memória física de 44 bits e 54 bits de endereçamento virtual.

- Até quatro processadores no mesmo barramento de sistema, a 266 MHz de frequência de dados.

· Compatibilidade com o chipset Intel 440GX.

Figura 3.47 – O encapsulamento do Itanium

Como já dissemos anteriormente, o Itanium foi desenhado de modo a fornecer características que permitam a escalabilidade, alta disponibilidade, performance, protecção de investimento e escolha para servidores de alto desempenho. O Itanium representa o mais significativo avanço para a arquitectura Intel desde o 80386.

A família Intel Itanium vem complementar a família de processadores de arquitectura IA- 32, (32 bits e 16 bits) suportada pelos Pentium e família de processadores P6. Todos os produtos da família de processadores Itanium são baseados na arquitectura com o mesmo nome, arquitectura essa que é baseada na filosofia de desenho EPIC. A arquitectura Itanium é mais do que uma arquitectura típica de 64 bits e foi desenhada de base de modo a preencher as necessidades da computação empresarial. A arquitectura incorpora algumas características avançadas de escalabilidade e performance, enquanto mantém compatibilidade binária com as instruções IA-32.

O Itanium é o primeiro processador da família Intel baseado na tecnologia EPIC (Explicity Instruction Computing). EPIC é uma nova filosofia de desenho que vai mais além das típicas RISC e CISC. A tecnologia EPIC permite um maior grau de paralelismo de instruções do que as tecnologias anteriores e é baseada numa combinação única de características como “prediction”, “speculation” e paralelismo explícito, o que permite uma maior performance em sistemas de alto desempenho .

Já referimos que uma das características do Itanium era o “prediction”, mas o que é isso? O prediction é a execução condicional das instruções. Nas arquitecturas tradicionais, a execução tradicional é executada através de branches ou ramificações. O prediction remove os branches usados para a execução condicional. Assim, o conceito de prediction diz-nos que a”execução predicada evita os branches e simplifica a optimização do compilador, convertendo uma dependência de controlo numa dependência de dados”.

Podemos ver um gráfico do funcionamento do predication na figura 3.48.

O predication substitui o branch predication, permitindo ao CPU executar todos os caminhos de branch possíveis.

Outras das características do Itanium é a sua cache L3 e, como já vimos anteriormente, há duas versões no que respeita ao tamanho da cache L3: 2 MB e 4 MB.

Figura 3.48 – Funcionamento do predication

Cache L3 está na cartridge do processador, tal como acontecia com a cache L2 doPentium II. A cartridge do processador com 2 MB contém o núcleo do processador e 2 MB de cache L3 composta por duas memórias SRAM de 1 MB. Quanto à versão de 4 MB, é composta por quatro memórias SRAM de 1 MB. Tanto numa como noutra versão, a cache L3, apesar de residir na cartridge, está totalmente isolada do núcleo do processador (figs. 3.49 e 3.50).

Figura 3.49 – Diagrama de blocos da cache L3 do Itanium 2 MB e 4 MB

Figura 3.50 – Diagrama de blocos do Itanium

Na tabela 3.18 pode ver algumas das características principais do Intel Itanium:


733

800

Apresentação

Maio 2001

Maio 2001

Velocidade de Relógio

733 MHz

800 MHz

Cache L3

2 MB ou 4 MB

2 MB ou 4 MB

Processamento de Fabrico

0,18u

0,18u

Encapsulamento

PAC418

PAC418

Tabela 3.18 – Características do Itanium