Universitat de Girona

Programa de l'assignatura

Curs 2004-05

3103200014 ANÀLISI AVANÇADA DE DADES


Objectius  

Als Estudis de Biologia, els coneixements estadístics estan organitzats en tres assignatures seqüenciades: Estadística, Experimentació i Anàlisi avançada de dades. A Anàlisi avançada de dades, es completa la formació bioestadística amb l’aprenentatge dels fonaments conceptuals, i sobretot l'aplicació, de dos grups de tècniques: l'anàlisi de regressió —una de les més importants a la pràctica— i l'anàlisi multivariable —fonamental per diverses especialitats biològiques. Paral·lelament, es dedica un esforç especial a l'aprenentatge de l'ús del paquet de programes estadístics SPSS —que és dels més complets i flexibles—, en versió Windows —que és molt més fàcil d'utilitzar que altres paquets o versions.
 
Prerrequisits  

És molt recomanable haver aprovat les assignatures "Estadística" i "Experimentació" o assignatures equivalents abans de cursar Anàlisi avançada de dades.
 
Contingut (Programa)  

Introducció

1. Anàlisi de variància (ANOVA). Revisió de l'ANOVA. Anàlisi de variància multivariable (MANOVA): necessitat (taxes d'error per comparació i experimental); aplicació; supòsits.

Correlació i regressió

2. Correlació lineal. Diferències entre correlació i regressió: objectiu de l'estudi i tipus de variables. Coeficient de correlació (lineal de Pearson), r: definició i propietats. Test de significació del coeficient de correlació. Aplicació de la correlació.

3. Testos no paramètrics. Fonament i aplicació. Coeficient de correlació (ordinal) de Spearman. Coeficient de correlació (ordinal) de Kendall (tau). Coeficient de concordança de Kendall, W.

4. Regressió lineal simple. Introducció. Model I: supòsits. Estimació de la funció o recta de regressió pel mètode de mínims quadrats (coeficient de regressió i ordenada a l'origen). Test de significació de la regressió (ANOVA). Errors estàndards, altres testos de significació i intervals de confiança. Cas amb replicació. Model II: predicció (les dues rectes de regressió del model I) o descripció.

5. Anàlisi de covariància (ANCOVA). ANCOVA d'un factor: disseny bàsic; test d'homogeneïtat de pendents (hipòtesi de paral·lelisme). Supòsits de l'ANCOVA. Altres dissenys.

6. Relacions no lineals. Transformacions en regressió lineal: principals funcions intrínsecament lineals. L'anàlisi de residus. Regressió no lineal: alguns models biològics no lineals (logístic, Michaelis-Menten, von Bertalanffy); procediment de la regressió no lineal; supòsits. Regressió polinomial: regressió quadràtica i cúbica; polinomis ortogonals.

7. Correlació i regressió múltiples. Anàlisi de regressió múltiple: introducció; testos de significació; coeficient de regressió parcial estandarditzat (beta); coeficient de determinació ajustat; coeficient de correlació múltiple (R). Coeficient de correlació parcial.

Ordenació i classificació

8. Ordenació i classificació. Tipus d'anàlisi multivariable: objectiu i tipus de dades. Recomanacions generals.

9. Anàlisi factorial. Anàlisi factorial i Anàlisi de components principals (PCA): terminologia. Objectiu i aplicacions. Procediment: estudi de la matriu de correlacions (mesura d’adequació mostral de Kaiser-Meyer-Olkin); extracció de factors (valors propis o eigenvalues; scree plot); rotació (ortogonal o obliqua); interpretació i presentació (pesos o saturacions factorials, factor loadings; coordenades factorials, factor scores).

10. Anàlisi de correspondències (CA) . Aplicació. Diferències entre CA i PCA. Efecte arc: anàlisi de correspondències sense la tendència (DCA).

11. Anàlisi de conglomerats (cluster analysis). Mètodes de classificació: no jeràrquics, jeràrquics divisius i jeràrquics aglomeratius. Mètodes jeràrquics aglomeratius: mesures de distància i similitud (variables mesurades: distància euclidiana, distància euclidiana al quadrat i similitud percentual o coeficient de Czekanowski o Bray-Curtis; variables qualitatives: simple matching, índex de Jaccard i índex de Sørensen, Czekanowski o Dice); aglomeració (single linkage o nearest neighbour, complete linkage o furthest neighbour i average linkage between groups o UPGMA). Aula: resolució de problemes sobre el programa teòric (disseny, càlcul i interpretació).

Aula informàtica: ús del NCSS Probability Calculator, de l'Excel i principalment del paquet estadístic SPSS (entorn Windows).

 
Bibliografia  


Bibliografia bàsica

Abraira Santos V. i Pérez de Vargas Luque A. 1996. Métodos multivariantes en bioestadística. Editorial Centro de Estudios Ramón Areces, Madrid. 452 p.   519.22 ABR

BISQUERRA ALZINA R. 1989. Introducción conceptual al análisis multivariable. Un enfoque informático con los paquetes SPSSX, BMDP, LISREL y SPAD. Vol. I. Promociones y Publicaciones Universitarias, Barcelona. 400 p.    519.23 BIS

Hair J.F.Jr., Anderson R.E., Tatham R.L. i Black W.C. 1999. Análisis multivariante. Prentice Hall, Madrid. 799 p.   519.23 ANA

JONGMAN R.H.G., TER BRAAK C.J.F. i VAN TONGEREN O.F.R. 1995. Data analysis in community and landscape ecology. Cambridge Univ. Press, Cambridge. 299 p.           502.6 DAT

LEGENDRE P. i LEGENDRE L. 1998. Numerical ecology. Elsevier, Amsterdam. 853 p.   574 LEG

SOKAL R.R. i ROHLF F.J. 1995. Biometry. The principles and practice of statistics in biological research. Freeman, New York. 887 p.     519.2 SOK

TABACHNICK B.G. i FIDELL L.S. 2001. Using multivariate statistics. Allyn and Bacon, Boston. 966 p.     519.2 TAB

 

Correlació i regressió. Bibliografia bàsica

Armitage P. i BERRY G. 1997. Estadística para la investigación biomédica. Harcourt-Brace, Madrid. 593 p.      519.2 ARM

DANIEL W.W. 1995. Bioestadística. Base para el análisis de las ciencias de la salud. Limusa, Mèxic. 878 p.       519.2 DAN

MONTGOMERY D.C. 1991. Diseño y análisis de experimentos. Grupo editorial Iberoamérica, México D.F.. 589 pp.           519.2 MON

Peña D. 2002. Regresión y diseño de experimentos. Alianza, Madrid. 744 p.       519.2 PEÑ

ZAR J.H. 1999. Biostatistical analysis. Prentice Hall, Upper Saddle River, NJ. 4a edició.   519.2 ZAR


 

Correlació i regressió. Bibliografia avançada

DRAPER N.R. i SMITH H. 1981. Applied regression analysis. Wiley, New York. 709 p.

HAND D.J. i TAYLOR C.C. 1987. Multivariate analysis of variance and repeated measures. A practical approach for behavioural scientists. Chapman and Hall, London. 262 p.

MONTGOMERY D.C., PECK E.A. i VINING G.G. 2001. Introduction to linear regression analysis. Wiley, New York. 641 p.

NETER J., WASSERMAN W. i KUTNER M.H. 1990. Applied linear statistical models. Regression, analysis of variance, and experimental designs. 3a ed. Richard D. Irwin Inc., Homewood (Illinois). 1181 p.

SEBER G.A.F. i WILD C.J. 1989. Nonlinear regression. Wiley, New York. 768 p.

 

Ordenació i classificació. Bibliografia bàsica

BISQUERRA ALZINA R. 1989. Introducción conceptual al análisis multivariable. Un enfoque informático con los paquetes SPSSX, BMDP, LISREL y SPAD. Vol. II. Promociones y Publicaciones Universitarias, Barcelona. 432 p.

EVERITT B.S. 1993. Cluster analysis. Arnold, London. 170 pp.

GAUCH H.G. 1982. Multivariate analysis in community ecology. Cambridge Univ. Press, Cambridge. 298 p.

PIELOU E.C. 1984. The interpretation of ecological data. A primer on classification and ordination. Wiley, New York. 263 p.

 

Ordenació i classificació. Bibliografia avançada

FERRANDO PIERA P.J. 1993. Introducción al análisis factorial. Promociones y Publicaciones Universitarias, Barcelona. 268 p.

GREENACRE H.J. 1993. Correspondence analysis in practice. Academic Press, London. 195 p.

JOHNSON R.A. i WICHERN D.W. 1988. Applied multivariate statistical analysis. Prentice-Hall, Englewood Cliffs NJ. 642 p.

Peña D. 2002. Análisis de datos multivariantes. Alianza, Madrid. 539 p.

 

Bibliografia introductòria

BAKUS G.J. 1990. Quantitative ecology and marine biology. A.A. Balkema, Rotterdam. 157 p.

JEFFERS J.N.R. 1991. Modelos en ecología. Oikos-tau, Barcelona. 96 p.

 

Diccionaris i enciclopèdies

Armitage P. & Colton T. (eds.) 1998. Encyclopedia of biostatistics. Wiley, Chichester. 6 vol.             RE 519.2:614

KOTZ S. i JOHNSON N.L. (eds.) 1981-1988. Encyclopedia of statistical sciences. Wiley, New York. 9 vol.            RE 51

Marriott F.H.C. 1990. A dictionary of statistical terms. Longman, Harlow. 5a ed. 223 p.

Sage University Papers. Series: Quantitative applications in the social sciences. Sage Publications, Newbury Park. Col.lecció d’uns 100 libres breus sobre aspectes estadístics concrets. Signatura biblioteca: 51(082.1) SAG.

SIERRA BRAVO R. 1991. Diccionario práctico de estadística y técnicas de investigación científica. Paraninfo, Madrid. 468 p.

Termcat (Centre de Terminologia). 1994. Diccionari d'estadística. Fundació Barcelona i Termcat, Barcelona. 98 p.

 

SPSS

CALVO GÓMEZ F. 1993. Técnicas estadísticas multivariantes. Con resolución de ejercicios prácticos mediante los paquetes estadísticos SPSS y PROGSTAD. Univ. de Deusto, Bilbao. 444 pp.

PÉREZ LÓPEZ C. 2001. Técnicas estadísticas con SPSS. Prentice Hall, Madrid. 571 p.

 

Bibliografia complementària

Peña D. 2001. Fundamentos de estadística. Alianza, Madrid. 683 p.        519.2 PEÑ

ROHLF F.J. i SOKAL R.R. 1995. Statistical tables. Freeman, New York.  199 p.

SACHS L. 1978. Estadística aplicada. Ed. Labor, Barcelona. 567 p.

SOKAL R.R. i ROHLF F.J. 1980. Introducción a la bioestadística. Ed. Reverté, Barcelona. 362 p.

 
Mètodes docents  

Classes magistrals de teoria

Resolució de problemes a l'aula

Classes de pràctiques a l'aula informàtica

 
Tipus d'exàmens i avaluacions  

Examen sobre el programa: aproximadament, el 40 % consisteix en preguntes teòriques («tipus test») i la resta en problemes.

L’assistència a les pràctiques (aula informàtica) és obligatòria: es controlarà l’assistència i es faran proves a l’aula per l’avaluació.

Per aprovar l’assignatura cal assistir a totes les sessions pràctiques (SPSS) i aprovar l’examen. La qualificació s’obté com el 70% de la qualificació de l’examen més el 30% de la de les pràctiques. Els exercicis realitzats en les classes de problemes i els treballs opcionals es ponderen amb la qualifificació de l’examen.

 
Informació addicional  

 
Llengua de les classes  

Català