You are here: TWiki> Cimec Web>LinpackHPF (2002-03-25, MarioStorti)
c -----------------------------------------------------------------
c Corridas con el "machi.dat":
c
c [ node4 node10 node11 node2 node3 node5 node6 node7 node8 ]
c
c  1	Caso 1: Linpack Benchmark en el pentium IV:
c
c  1.1 Linpack BenchMark para n=100 modificado (por Mario) 
c		para una mejor estadistica en la medicion de los
c		tiempos:
c
c		programa: lb100dl.exe para n=100 (modificado)
c
c		[jdelia@node4 MARIO]$ lb100dl.exe
c
c  On iter				1 ttot:	 29.30421999789542	  
c  On iter				2 ttot:	 30.86016397777712	  
c  On iter				3 ttot:	 32.51111894520000	  
c  Elapsed:	 27.74828	  per iter:	2.7748274E-03 rate: 
c				 247.4628235224679  [mflops]
c  FORTRAN STOP
c
c  1.2 Linpack BenchMark para n=100 provisto por PGI y con una 
c		modificacion parecida a la de Mario para una mejor 
c		estadistica en la medicion de los tiempos:
c
c		programa: linpkrd.exe para n=100 (provisto por PGI)
c
c		jdelia@node4 LINPACK]$ linpkrd.exe
c
c  norm. resid	resid		 machep		x(1)-1		x(n)-1
c  1.89264926E+0 8.39916E-14 2.22045E-16 -6.2284E-14 -4.163E-14
c
c times are reported for matrices of order	100
c		sgefa		sgesl		total	  Kflops		 unit		ratio
c
c times for array with leading dimension of 201
c	 0.00269	 0.00012	 0.00280	 244897.	 0.00817	 0.05007
c	 0.00267	 0.00011	 0.00278	 246561.	 0.00811	 0.04973
c	 0.00278	 0.00011	 0.00289	 237268.	 0.00843	 0.05168
c	 0.00278	 0.00000	 0.00278	 246971.	 0.00810	 0.04965
c
c times for array with leading dimension of 200
c	 0.00272	 0.00011	 0.00284	 242038.	 0.00826	 0.05066
c	 0.00268	 0.00011	 0.00278	 246647.	 0.00811	 0.04971
c	 0.00267	 0.00011	 0.00278	 246736.	 0.00811	 0.04970
c	 0.00278	 0.00000	 0.00278	 246734.	 0.00811	 0.04970
c
c ROLLED DOUBLE  PRECISION LINPACK PERFORMANCE		 246734 KFLOPS 
c FORTRAN STOP
c
c  2	Caso 2: Solucion por Gauss del Sistema de Ecuaciones 
c				  Algebraicas Lineales (SEAL) A x = b de 
c				  dimension "n", por distribucion de datos con 
c				  HPF, como programa fuente, y MPI como paso de 
c				  mensajes (indirectamente por uso de libreria):
c
c  2.1 corridas para 11 valores de "n" en p = 8 procesadores,
c		con "tpo" en [seg.]
c				n  tpo  MFlops
c		 1 1000	14  47
c		 2 1200	21  56
c		 3 1400	29  64
c		 4 1600	39  71
c		 5 1800	50  78
c		 6 2000	66  83
c		 7 2200	83  86
c		 8 2400  103  90
c		 9 2600  125  95
c		10 2800  149  98
c		11 3000  185  98
c
c  2.2 Speedup en solucion por Gauss (bajo por intensa comunicacion):
c
c		n = 2500  ; numero de incognitas
c		p			; numero de procesadores
c		r =	50  ; MBytes para toda la matriz A
c		d = r / p ; MBytes de la matriz A en cada nodo
c
c	p		  1	  2	  3	  4	  5	  6	  7	  8	  9
c	d		 50	 25	 16.7  12.5  10.0	8.4	7.2	6.3	5.6
c	MFlops  28.1  41.9  58.1  70.8  82.6  89.1  91.6  92.4  90.9
c	speedup  1.0	1.5	2.1	2.6	2.9	3.3	3.3	3.2	3.2
c
c -----------------------------------------------------------------

-- MarioStorti - 25 Mar 2002
Topic revision: r1 - 2002-03-25 - 11:34:35 - MarioStorti
 

TWIKI.NET
This site is powered by the TWiki collaboration platformCopyright � by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback