Resumo:
Com o aumento da quantidade de dados coletados, o desempenho computacional se
torna um fator crucial para indicar o sucesso ou o fracasso da execução de uma
aplicação científica. Existem opções de arquiteturas que demonstraram grande poder
de processamento, no entanto são subtilizadas. Uma delas é a Unidade de
Processamento Gráfico, GPU (Graphic Processing Unit). O presente trabalho analisa o
desempenho computacional deste ambiente, através da implementação do algoritmo de
multiplicação matricial. Este foi escolhido devido a sua grande variedade de
implementações, desenvolvido na linguagem OpenCL. A problemática é identificar a
arquitetura mais vantajosa, através de comparações entre máquinas com o
processamento convencional, CPU (Central Processing Unit), com as que possuam
GPU acoplada à placa de vídeo. Foi criado e aperfeiçoado o código em C++ para que
atuasse de forma a acelerar o processamento, e posteriormente transcrito em OpenCL.
Em seguida, foram executados os testes em máquinas com CPU e em outro dispositivo
que também possua GPU. Após a obtenção dos resultados, os mesmos foram
analisados e comparados, e demonstraram que a GPU se sobressai quando há uma
grande quantidade de dados.