2,208 matches
-
Construcția și tehnologia sistemelor embedded 38 este că planificarea instrucțiunilor este terminată înainte de a începe execuția codului. Putem vorbi de o planificare statică a lansării multiple de instrucțiuni în execuție. În figura 2.13 se prezintă modul de lucru al procesoarelor VLIW. Figura 2.13 Procesor cu un cuvânt VLIW de două instrucțiuni Pentru simplitate, cuvântul VLIW cuprinde 2 instrucțiuni care controlează fiecare câte o cale de date. După cum se poate observa în desfășurarea temporală a conținutului cuvântului VLIW, în cazul
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
38 este că planificarea instrucțiunilor este terminată înainte de a începe execuția codului. Putem vorbi de o planificare statică a lansării multiple de instrucțiuni în execuție. În figura 2.13 se prezintă modul de lucru al procesoarelor VLIW. Figura 2.13 Procesor cu un cuvânt VLIW de două instrucțiuni Pentru simplitate, cuvântul VLIW cuprinde 2 instrucțiuni care controlează fiecare câte o cale de date. După cum se poate observa în desfășurarea temporală a conținutului cuvântului VLIW, în cazul în care compilatorul nu poate
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
de date. După cum se poate observa în desfășurarea temporală a conținutului cuvântului VLIW, în cazul în care compilatorul nu poate rezolva interdependențele dintre instrucțiuni sau căile de date sunt momentan ocupate, compilatorul poate introduce instrucțiuni nop (no operationă. Exemplu de procesor VLIW este procesorul digital de semnal (DSPĂ Texas Instruments TMS320C67. Procesoarele superscalare Un procesor superscalar este capabil să execute simultan mai multe instrucțiuni din conducte independente de instrucțiuni. Procesoarele superscalare au planificator dinamic care examinează instrucțiunile din memorie și decide
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
se poate observa în desfășurarea temporală a conținutului cuvântului VLIW, în cazul în care compilatorul nu poate rezolva interdependențele dintre instrucțiuni sau căile de date sunt momentan ocupate, compilatorul poate introduce instrucțiuni nop (no operationă. Exemplu de procesor VLIW este procesorul digital de semnal (DSPĂ Texas Instruments TMS320C67. Procesoarele superscalare Un procesor superscalar este capabil să execute simultan mai multe instrucțiuni din conducte independente de instrucțiuni. Procesoarele superscalare au planificator dinamic care examinează instrucțiunile din memorie și decide care din ele
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
cuvântului VLIW, în cazul în care compilatorul nu poate rezolva interdependențele dintre instrucțiuni sau căile de date sunt momentan ocupate, compilatorul poate introduce instrucțiuni nop (no operationă. Exemplu de procesor VLIW este procesorul digital de semnal (DSPĂ Texas Instruments TMS320C67. Procesoarele superscalare Un procesor superscalar este capabil să execute simultan mai multe instrucțiuni din conducte independente de instrucțiuni. Procesoarele superscalare au planificator dinamic care examinează instrucțiunile din memorie și decide care din ele vor fi plasate în fiecare conductă de instrucțiuni
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
cazul în care compilatorul nu poate rezolva interdependențele dintre instrucțiuni sau căile de date sunt momentan ocupate, compilatorul poate introduce instrucțiuni nop (no operationă. Exemplu de procesor VLIW este procesorul digital de semnal (DSPĂ Texas Instruments TMS320C67. Procesoarele superscalare Un procesor superscalar este capabil să execute simultan mai multe instrucțiuni din conducte independente de instrucțiuni. Procesoarele superscalare au planificator dinamic care examinează instrucțiunile din memorie și decide care din ele vor fi plasate în fiecare conductă de instrucțiuni disponibilă. Această planificare
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
momentan ocupate, compilatorul poate introduce instrucțiuni nop (no operationă. Exemplu de procesor VLIW este procesorul digital de semnal (DSPĂ Texas Instruments TMS320C67. Procesoarele superscalare Un procesor superscalar este capabil să execute simultan mai multe instrucțiuni din conducte independente de instrucțiuni. Procesoarele superscalare au planificator dinamic care examinează instrucțiunile din memorie și decide care din ele vor fi plasate în fiecare conductă de instrucțiuni disponibilă. Această planificare dinamică permite lansarea și execuția instrucțiunilor out-of-order (ordine diferită de cea din programă. În figura
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
și decide care din ele vor fi plasate în fiecare conductă de instrucțiuni disponibilă. Această planificare dinamică permite lansarea și execuția instrucțiunilor out-of-order (ordine diferită de cea din programă. În figura 2.14 se prezintă structura de ansamblu a unui procesor superscalar cu trei conducte de instrucțiuni ce operează asupra a trei căi de date Figura 2.14 Procesor superscalar cu trei conducte de instrucțiuni Se permite astfel execuția a până la trei instrucțiuni pe ciclu de tact. Capitolul 2 Unitatea centrală
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
lansarea și execuția instrucțiunilor out-of-order (ordine diferită de cea din programă. În figura 2.14 se prezintă structura de ansamblu a unui procesor superscalar cu trei conducte de instrucțiuni ce operează asupra a trei căi de date Figura 2.14 Procesor superscalar cu trei conducte de instrucțiuni Se permite astfel execuția a până la trei instrucțiuni pe ciclu de tact. Capitolul 2 Unitatea centrală de prelucrare a sistemelor embedded Construcția și tehnologia sistemelor embedded 39 Arhitectura superscalară asigură astfel rate de execuție
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
a până la trei instrucțiuni pe ciclu de tact. Capitolul 2 Unitatea centrală de prelucrare a sistemelor embedded Construcția și tehnologia sistemelor embedded 39 Arhitectura superscalară asigură astfel rate de execuție a instrucțiunilor mai mari decât frecvența semnalului de tact. Toate procesoarele moderne de înaltă performanță au arhitectură superscalară. Deosebirea între arhitectura VLIW și cea superscalară rezidă în modul de planificare și lansare în execuție a instrucțiunilor. La procesoarele VLIW compilatorul este responsabil de aceste funcțiuni, la procesoarele superscalare chiar procesorul, prin
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
rate de execuție a instrucțiunilor mai mari decât frecvența semnalului de tact. Toate procesoarele moderne de înaltă performanță au arhitectură superscalară. Deosebirea între arhitectura VLIW și cea superscalară rezidă în modul de planificare și lansare în execuție a instrucțiunilor. La procesoarele VLIW compilatorul este responsabil de aceste funcțiuni, la procesoarele superscalare chiar procesorul, prin planificatorul dinamic, după cum se poate observa în figura 2.15. Figura 2.15 Procesor superscalar cu trei conducte de instrucțiuni Există totuși limitări în creșterea performanțelor procesoarelor
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
semnalului de tact. Toate procesoarele moderne de înaltă performanță au arhitectură superscalară. Deosebirea între arhitectura VLIW și cea superscalară rezidă în modul de planificare și lansare în execuție a instrucțiunilor. La procesoarele VLIW compilatorul este responsabil de aceste funcțiuni, la procesoarele superscalare chiar procesorul, prin planificatorul dinamic, după cum se poate observa în figura 2.15. Figura 2.15 Procesor superscalar cu trei conducte de instrucțiuni Există totuși limitări în creșterea performanțelor procesoarelor superscalare la creșterea numărului conductelor de instrucțiuni, limitări ce
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
Toate procesoarele moderne de înaltă performanță au arhitectură superscalară. Deosebirea între arhitectura VLIW și cea superscalară rezidă în modul de planificare și lansare în execuție a instrucțiunilor. La procesoarele VLIW compilatorul este responsabil de aceste funcțiuni, la procesoarele superscalare chiar procesorul, prin planificatorul dinamic, după cum se poate observa în figura 2.15. Figura 2.15 Procesor superscalar cu trei conducte de instrucțiuni Există totuși limitări în creșterea performanțelor procesoarelor superscalare la creșterea numărului conductelor de instrucțiuni, limitări ce Țin de interdependențele
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
superscalară rezidă în modul de planificare și lansare în execuție a instrucțiunilor. La procesoarele VLIW compilatorul este responsabil de aceste funcțiuni, la procesoarele superscalare chiar procesorul, prin planificatorul dinamic, după cum se poate observa în figura 2.15. Figura 2.15 Procesor superscalar cu trei conducte de instrucțiuni Există totuși limitări în creșterea performanțelor procesoarelor superscalare la creșterea numărului conductelor de instrucțiuni, limitări ce Țin de interdependențele din program: dependențe de date; Paralelismul la nivel de procesor O altă abordare în creșterea
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
procesoarele VLIW compilatorul este responsabil de aceste funcțiuni, la procesoarele superscalare chiar procesorul, prin planificatorul dinamic, după cum se poate observa în figura 2.15. Figura 2.15 Procesor superscalar cu trei conducte de instrucțiuni Există totuși limitări în creșterea performanțelor procesoarelor superscalare la creșterea numărului conductelor de instrucțiuni, limitări ce Țin de interdependențele din program: dependențe de date; Paralelismul la nivel de procesor O altă abordare în creșterea performanțelor unui microprocesor este utilizarea mai multor nuclee procesor în aceeași capsulă, fiecare
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
2.15. Figura 2.15 Procesor superscalar cu trei conducte de instrucțiuni Există totuși limitări în creșterea performanțelor procesoarelor superscalare la creșterea numărului conductelor de instrucțiuni, limitări ce Țin de interdependențele din program: dependențe de date; Paralelismul la nivel de procesor O altă abordare în creșterea performanțelor unui microprocesor este utilizarea mai multor nuclee procesor în aceeași capsulă, fiecare cu memoria sa cache de nivel 1 și 2 și cu memorie cache nivel 3 și memorie principală DRAM comune. Un exemplu
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
limitări în creșterea performanțelor procesoarelor superscalare la creșterea numărului conductelor de instrucțiuni, limitări ce Țin de interdependențele din program: dependențe de date; Paralelismul la nivel de procesor O altă abordare în creșterea performanțelor unui microprocesor este utilizarea mai multor nuclee procesor în aceeași capsulă, fiecare cu memoria sa cache de nivel 1 și 2 și cu memorie cache nivel 3 și memorie principală DRAM comune. Un exemplu de microprocesor cu structură multicore este Intel Core i7. Capitolul 2 Unitatea centrală de
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
cache nivel 3 și memorie principală DRAM comune. Un exemplu de microprocesor cu structură multicore este Intel Core i7. Capitolul 2 Unitatea centrală de prelucrare a sistemelor embedded Construcția și tehnologia sistemelor embedded 40 Figura 2.16 Structura multicore a procesorului Intel i7 Un procesor similar, dar de la AMD, este Opteron X4 Barcelona. Figura 2.17 Structura multicore a procesorului AMD Opteron X4 Barcelona Structuri multiprocesor cu foarte multe unități de execuție sunt procesoarele grafice moderne. În figura 2.18 se
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
memorie principală DRAM comune. Un exemplu de microprocesor cu structură multicore este Intel Core i7. Capitolul 2 Unitatea centrală de prelucrare a sistemelor embedded Construcția și tehnologia sistemelor embedded 40 Figura 2.16 Structura multicore a procesorului Intel i7 Un procesor similar, dar de la AMD, este Opteron X4 Barcelona. Figura 2.17 Structura multicore a procesorului AMD Opteron X4 Barcelona Structuri multiprocesor cu foarte multe unități de execuție sunt procesoarele grafice moderne. În figura 2.18 se prezintă procesorul grafic nVidia
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
Capitolul 2 Unitatea centrală de prelucrare a sistemelor embedded Construcția și tehnologia sistemelor embedded 40 Figura 2.16 Structura multicore a procesorului Intel i7 Un procesor similar, dar de la AMD, este Opteron X4 Barcelona. Figura 2.17 Structura multicore a procesorului AMD Opteron X4 Barcelona Structuri multiprocesor cu foarte multe unități de execuție sunt procesoarele grafice moderne. În figura 2.18 se prezintă procesorul grafic nVidia Fermi. Capitolul 2 Unitatea centrală de prelucrare a sistemelor embedded Construcția și tehnologia sistemelor embedded
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
40 Figura 2.16 Structura multicore a procesorului Intel i7 Un procesor similar, dar de la AMD, este Opteron X4 Barcelona. Figura 2.17 Structura multicore a procesorului AMD Opteron X4 Barcelona Structuri multiprocesor cu foarte multe unități de execuție sunt procesoarele grafice moderne. În figura 2.18 se prezintă procesorul grafic nVidia Fermi. Capitolul 2 Unitatea centrală de prelucrare a sistemelor embedded Construcția și tehnologia sistemelor embedded 41 Figura 2.18 Structura unui GPU programabil Nvidia Fermi Modul de utilizare al
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
i7 Un procesor similar, dar de la AMD, este Opteron X4 Barcelona. Figura 2.17 Structura multicore a procesorului AMD Opteron X4 Barcelona Structuri multiprocesor cu foarte multe unități de execuție sunt procesoarele grafice moderne. În figura 2.18 se prezintă procesorul grafic nVidia Fermi. Capitolul 2 Unitatea centrală de prelucrare a sistemelor embedded Construcția și tehnologia sistemelor embedded 41 Figura 2.18 Structura unui GPU programabil Nvidia Fermi Modul de utilizare al resurselor este diferit între un procesor de uz general
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
18 se prezintă procesorul grafic nVidia Fermi. Capitolul 2 Unitatea centrală de prelucrare a sistemelor embedded Construcția și tehnologia sistemelor embedded 41 Figura 2.18 Structura unui GPU programabil Nvidia Fermi Modul de utilizare al resurselor este diferit între un procesor de uz general și un procesor pentru operații grafice: Figura 2.19 Diferențe legate de modul de alocare a resurselor la un procesor de uz general și la unul pentru calcule grafice Reducerea consumului de energie Consumul de energie și
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
Fermi. Capitolul 2 Unitatea centrală de prelucrare a sistemelor embedded Construcția și tehnologia sistemelor embedded 41 Figura 2.18 Structura unui GPU programabil Nvidia Fermi Modul de utilizare al resurselor este diferit între un procesor de uz general și un procesor pentru operații grafice: Figura 2.19 Diferențe legate de modul de alocare a resurselor la un procesor de uz general și la unul pentru calcule grafice Reducerea consumului de energie Consumul de energie și mai ales evacuarea căldurii dezvoltate reprezintă
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]
-
2.18 Structura unui GPU programabil Nvidia Fermi Modul de utilizare al resurselor este diferit între un procesor de uz general și un procesor pentru operații grafice: Figura 2.19 Diferențe legate de modul de alocare a resurselor la un procesor de uz general și la unul pentru calcule grafice Reducerea consumului de energie Consumul de energie și mai ales evacuarea căldurii dezvoltate reprezintă un factor de limitare a creșterii vitezei de prelucrare a datelor a procesoarelor actuale. Limita de 100-150W
CONSTRUCŢIA ŞI TEHNOLOGIA SISTEMELOR EMBEDDED by Andrei DRUMEA () [Corola-publishinghouse/Science/674_a_1069]