СУПЕРВЫЧИСЛЕНИЯ:средства, теория, образование


The Presentation inside:

Slide 0

Московский государственный университет им.М.В.Ломоносова Институт вычислительной математики РАН www.parallel.ru Воеводин В.В., Воеводин Вл.В. СУПЕРВЫЧИСЛЕНИЯ: средства, теория, образование


Slide 1

Почему возникают проблемы пользователей? Проблемы пользователей в примерах. Математические трудности решения проблемы. Информационная структура алгоритмов. Не научные проблемы.


Slide 2

Увеличение производительности ЭВМ - за счет чего? EDSAC, 1949 год HP Superdome, 2001 год такт: 2*10-6с 1.5*103 1.3*10-9с произв.: 102 оп/с 1.9*109 1.9*1011 оп/c


Slide 3

ASCI White - первое место в Top500 8192 процессора Power3 (512 * 16) Оперативная память - 4Тбайта Дисковый массив - 160Тбайт Пиковая производительность - более 12Tflops flops - floating operations per second M - 106, G - 109, T - 1012


Slide 4

Системы параллельного программирования Зарубежные: Linda, PVM, MPI, High Performance Fortran, OpenMP ... Отечественные: НОРМА, DVM, Т-система, mpC ... Все системы в той или иной мере требуют от пользователя дополнительную информацию


Slide 5

Откуда брать дополнительную информацию? Образование и штатное программное обеспечение слабо поддерживают процессы ее получения.


Slide 6

Почему возникают проблемы пользователей? Проблемы пользователей в примерах. Математические трудности решения проблемы. Информационная структура алгоритмов. Не научные проблемы.


Slide 7

Результаты оптимизации программы TRFD из пакета PERFECT CLUB BENCHMARK на суперкомпьютерах CRAY Baseline - результаты, полученные с помощью штатного компилятора Manual opt. - результаты, полученные с помощью ручной оптимизации специалистами высокого класса V-Ray opt. - результаты, полученные на основе информации, выданной V-Ray system


Slide 8

Пользователь: почему? Aijk = Ai-1jk + Bjk + Bjk, i=1,40; j=1,40; k=1,1000 do k = 1, 1000 do j = 1, 40 do i = 1, 40 A(i,j,k) = A(i-1,j,k)+B(j,k)+B(j,k) Производительность: 20 Mflops на Cray Y-MP C90


Slide 9

Пользователь: почему? Aijk = Ai-1jk + Bjk + Bjk, i=1,40; j=1,40; k=1,1000 do i = 1, 40, 2 do j = 1, 40 do k = 1, 1000 A(i,j,k) = A(i-1,j,k)+2*B(j,k) A(i+1,j,k) = A(i,j,k)+2*B(j,k) Производительность: 700 Mflops на Cray Y-MP C90


Slide 10

DO i = 1, n DO j = 1, n U( i + j ) = U( 2*n – i – j + 1)*q + p EndDO EndDO Простой пример...


Slide 11

DO i = 1, n DO j = 1, n – i U( i + j ) = U( 2*n – i – j + 1)*q + p End DO DO j = n – i + 1, n U( i + j ) = U( 2*n – i – j + 1)*q + p End DO End DO Простой пример...


Slide 12


Slide 13

Факт: нет хороших технологий “распараллеливания” вычислений и адаптации программ к требованиям больших вычислительных систем Причина: в нужной мере не владеем знаниями и возможностями новой междисциплинарной математической области исследований - информационной структуры алгоритмов, объединяющей алгоритмы, программирование, модели вычислительных систем и др.


Slide 14

Почему возникают проблемы пользователей? Проблемы пользователей в примерах. Математические трудности решения проблемы. Информационная структура алгоритмов. Не научные проблемы.


Slide 15


Slide 16

DO i = 1,n DO j = 1,n-i+1 A(I,J) = … B (I,J) … B(I,J) = … A (I,J) … ENDDO ENDDO Л.Лампорт А.П.Ершов


Slide 17

DO i = 1,n DO j = 1,n-i+1 A(I,J) = … B (I,J-1) … B(I,J) = … A (I,J) … ENDDO ENDDO Л.Лампорт А.П.Ершов


Slide 18

S = 0 DO i = 1,n S = S + A(I) ENDDO Л.Лампорт А.П.Ершов


Slide 19

Базовая математическая задача Для любого вектора I ? ?N построить множество векторов Ji ? ?iN, удовлетворяющих уравнениям: piN(Ji) = qN(I), и на этих множествах найти вектор J = J(I, N), лексикографически ближайший к I снизу. Все объекты зависят от вектора внешних переменных N, который на момент решения базовой задачи неизвестен. Решение необходимо находить точно и в явном виде.


Slide 20

Почему возникают проблемы пользователей? Проблемы пользователей в примерах. Математические трудности решения проблемы. Информационная структура алгоритмов. Не научные проблемы.


Slide 21

Информационная структура алгоритмов Для широкого класса алгоритмов и программ разработаны эффективные методы нахождения всех графов зависимостей. Графы точно описываются конечными наборами простых функций. Используя явное представление графов, разработаны эффективные методы их исследования. Теперь об этих графах можно узнать практически все. Построена первая очередь автономной системы V-Ray system для обнаружения параллелизма в больших программных комплексах. Обнаружены многочисленные междисциплинарные связи.


Slide 22

Близкие проблемы Быстрое вычисление градиента и производной Быстрое восстановление линейного функционала Анализ влияния ошибок округления Декомпозиция алгоритмов Восстановление математических формул Обнаружение узких мест алгоритма (по памяти, точности и т.п.) Разработка параллельных численных методов Разработка переносимого программного обеспечения Использование распределенной и иерархической памяти Выбор оптимальной архитектуры компьютера Построение систолических массивов Разработка параллелизующих компиляторов и многое другое


Slide 23

Гипотеза Типовых информационных структур алгоритмов в конкретных областях немного Практика подтверждает гипотезу


Slide 24

Почему возникают проблемы пользователей? Проблемы пользователей в примерах. Математические трудности решения проблемы. Информационная структура алгоритмов. Не научные проблемы.


Slide 25

Не научные проблемы катастрофическая нехватка кадров, особенно высококвалифицированных, недостаточная образованность на разных уровнях, недооценка трудностей использования больших вычислительных систем, разрозненность усилий специалистов, отсутствие учебников и учебных пособий, отсутствие полноценного программного сервиса, внедрение новых образовательных технологий, информационный “портал” МГУ


×

HTML:





Ссылка: