Wykorzystanie algorytmów Text Mining do analizy danych tekstowych w psychologii
SOCJOLINGWISTYKA,
Tom 31 (2017): Socjolingwistyka
Abstrakt
W psychologii analizy danych zapisanych w postaci tekstów stanowią ważny element prac badawczych. Niemniej nadal poszukuje się narzędzi, metod, które mogą umożliwić szybką analizę danych zarejestrowanych w postaci tekstów, gdyż analizy te są najczęściej bardzo czasochłonne. W prezentowanym artykule przybliżono metodę text mining, która ma szczególne zastosowanie w analizie informacji zapisanych w postaci danych tekstowych. Wykorzystanie metody text mining jest omawiane na przykładzie analizy obieranych przez rodziców celów wychowawczych.. W artykule przedstawiono sposób, w jaki algorytmy text mining: a) dokonują analizy tekstu przez zliczenie słów i nadanie im wag, b) przeprowadzają analizę relacji między słowami za pomocą składowych głównych (Principal Component Analysis), c) przekształcają dane słownew liczbowe, przygotowując zbiór danych do kolejnych obliczeń.
Słowa kluczowe
- Alqarni M., Arabi Y., Kakiashvili T., Khedr M., Koczkodaj W.W., Leszek J., Przelaskowski A., Rutkowski K. 2011: Improving the predictability of ICU illness severity scales, Computer Science and Information Systems, 11–17.
- Aranowska E. 1996: Metodologiczne problemy zastosowań modeli statystycznych w psychologii. Teoria i praktyka, Warszawa: Studio 1.
- Aranowska E. 2005: Pomiar ilościowy w psychologii, Warszawa: Wydawnictwo Naukowe Scholar.
- Aranowska E., Ciok A. 1992: Związki między zmiennymi w interpretacji analizy składowych głównych i analizy korespondencji, [w:] Aranowska E. (red.), Wybrane problemy metodologii badań, Warszawa: Wydawnictwa Uniwersytetu Warszawskiego, 133–181.
- Bartholomew D.J., Steele F., Moustaki I., Galbraith J.I. 2008: Analysis of multivariate social sciencedata, Boca Raton, FL: Chapman & Hall/CRC Press.
- Bouchet-Valat M., Bastin G. 2013: RcmdrPlugin.temis, a Graphical Integrated Text Mining Solution in R, The R Journal 5(1), 188–196.
- Brzezińska A. 2002: Społeczna psychologia rozwoju [Social psychology of development], Warszawa: Wydawnictwo Naukowe Scholar.
- Elder J., Hill T., Miner G., Nisbet B., Delen D., Fast A. 2012: Practical Text Mining and Statistical Analysis for Nono-structured Text Data Application, Oxford: Elsevier.
- Franzosi R. 2010: Quantitative narrative analysis, Thousand Oaks, CA: SAGE Publications.
- Glenn E. 2005: Incorporating parental goals in parenting programs through collaborative relationships with parents, Journal of Extension 43(1).
- Hotho A., Nürnberger A., Paaß G. 2005: A Brief Survey of Text Mining. A Brief Survey of Text Mining (Ldv. Forum), <http://www.jlcl.org/2005_Heft1/19-62_HothoNuernbergerPaass.pdf>.
- Krupa T. 1995: Sztuczna inteligencja, Prace Naukowe Instytutu Technologii Maszyn i Automatyzacji Politechniki Wrocławskiej 57, 146–165.
- Luger G.F. Stubblefield W.A. 1989: Artificial Intelligence and the Design of Expert Systems, Redwood City, California: The Benjamin/Cummings Publishing Company, Inc.
- Manning Ch.D., Schütze H. 2002: Foundations of statistical natural language processing, ACM SIGMOD Record 31(3), 37, <http://doi.org/10.1145/601858.601867>.
- Miller R. 1966: Proces wychowania i jego wyniki [The upbringing process and its results], Warszawa: Biblioteka Nauczyciela PZWS.
- Muszyński H. 1972: Ideał i cele wychowania [The ideal and goals of upbringing], Warszawa: Biblioteka Nauczyciela PZWS.
- Nisbet R., Elder J., Miner G. 2009: Handbook of Statistical Analysis and Data Mining Applications, Burlington, MA: Academic Press (Elsevier).
- Rutkowski L. 2006: Metody i techniki sztucznej inteligencji, Warszawa: Wydawnictwo Naukowe PWN.
- Rzechowska E. 2004: Potencjalność w procesie rozwoju. Mikroanaliza konstruowania wiedzy w dziecięcych interakcjach rówieśniczych, Lublin: Wydawnictwo KUL.
- Rzechowska E. 2011a: Dojrzały pracownik na rynku pracy. Jak zabezpieczyć przed wykluczeniem społecznym osoby 50+?, Lublin: Wydawnictwo Lubelskiej Szkoły Biznesu.
- Rzechowska E. 2011b: Podejście procesualne. Warianty badań nad procesami w mikro- i makroskali, Roczniki Psychologiczne 14(1), 127–157.
- Sośnicki K. 1966: Istota i cele wychowania [The essence and goals of upbringing], Warszawa: Nasza Księgarnia.
- Spärck Jones K. 1972: A Statistical Interpretation of Term Specificity and its Retrieval, Journal of Documentation 28(1), 11–21, <http://doi.org/10.1108/eb026526>.
- Szymańska A. 2011: Parental Stress in an Upbringing Situation and Giving Children Help: A Model of the Phenomenon, International Journal of Interdisciplinary Social Sciences 6(3), 141–153.
- Szymańska A. 2012a: Parental Directiveness as a Predictor of Children’s Behavior at Kindergarten, Psychology of Language and Communication 16(3), 1–24.
- Szymańska A. 2012b: Doświadczanie trudności w sytuacji wychowawczej a reprezentacja dziecka w umyśle rodzica: model zjawiska, Psychologia Rozwojowa 17(4), 79–91.
- Szymańska A. 2015: Wykorzystanie algorytmu Text Mining do analizy przyjmowanych przez rodziców celów wychowawczych, Warszawa: XXIV Konferencja Psychologii Rozwojowej.
- Szymańska A. 2016: Przejście od danych jakościowych do ilościowych — aplikacja algorytmu Text Mining do budowy modeli SEM, XXV Jubileuszowa Ogólnopolska Konferencja Psychologii Rozwojowej, Kraków: XXV Jubileuszowa Ogólnopolska Konferencja Psychologii Rozwojowej.
- Tarwacka-Odolczyk A., Tomaszewski P., Szymańska A., Bokus B. 2014: Deaf children building narrative texts. Effect of adult-shared vs. non-shared perception of a picture story, Psychology of Language and Communication 18(2), 149–177.
- Torebko K., Szymańska A. 2015: Zastosowanie algorytmu Classification & Regression Tree (C & RT) do wyjaśnienia relacji pomiędzy błędami wychowawczymi popełnianymi przez rodziców a rozwojem kompetencji emocjonalnych dzieci w wieku wczesnoszkolnym, Warszawa: XXIV Konferencja Psychologii Rozwojowej.
- Ważyńska A., Szymańska A., Bartczak M., Bokus B. 2015: Przy okrągłym stole dialogowego Ja. Gdzie siedzi sceptyk?, [w:] Bokus B., Kosowska E. (red.), O wątpieniu, Piaseczno: Studio Lexem, 63–82.
- Yim H.Y.B., Boo Y.L., Ebbeck M. 2014: A Study of Children’s Musical Preference: A Data Mining Approach, Australian Journal of Teacher Education 39(2), 21–34. Żurada J., Barski M., Jędruch W. 1996: Sztuczne sieci neuronowe. Warszawa: Państwowe Wydawnictwo Naukowe.
Referencje
Alqarni M., Arabi Y., Kakiashvili T., Khedr M., Koczkodaj W.W., Leszek J., Przelaskowski A., Rutkowski K. 2011: Improving the predictability of ICU illness severity scales, Computer Science and Information Systems, 11–17.
Aranowska E. 1996: Metodologiczne problemy zastosowań modeli statystycznych w psychologii. Teoria i praktyka, Warszawa: Studio 1.
Aranowska E. 2005: Pomiar ilościowy w psychologii, Warszawa: Wydawnictwo Naukowe Scholar.
Aranowska E., Ciok A. 1992: Związki między zmiennymi w interpretacji analizy składowych głównych i analizy korespondencji, [w:] Aranowska E. (red.), Wybrane problemy metodologii badań, Warszawa: Wydawnictwa Uniwersytetu Warszawskiego, 133–181.
Bartholomew D.J., Steele F., Moustaki I., Galbraith J.I. 2008: Analysis of multivariate social sciencedata, Boca Raton, FL: Chapman & Hall/CRC Press.
Bouchet-Valat M., Bastin G. 2013: RcmdrPlugin.temis, a Graphical Integrated Text Mining Solution in R, The R Journal 5(1), 188–196.
Brzezińska A. 2002: Społeczna psychologia rozwoju [Social psychology of development], Warszawa: Wydawnictwo Naukowe Scholar.
Elder J., Hill T., Miner G., Nisbet B., Delen D., Fast A. 2012: Practical Text Mining and Statistical Analysis for Nono-structured Text Data Application, Oxford: Elsevier.
Franzosi R. 2010: Quantitative narrative analysis, Thousand Oaks, CA: SAGE Publications.
Glenn E. 2005: Incorporating parental goals in parenting programs through collaborative relationships with parents, Journal of Extension 43(1).
Hotho A., Nürnberger A., Paaß G. 2005: A Brief Survey of Text Mining. A Brief Survey of Text Mining (Ldv. Forum), <http://www.jlcl.org/2005_Heft1/19-62_HothoNuernbergerPaass.pdf>.
Krupa T. 1995: Sztuczna inteligencja, Prace Naukowe Instytutu Technologii Maszyn i Automatyzacji Politechniki Wrocławskiej 57, 146–165.
Luger G.F. Stubblefield W.A. 1989: Artificial Intelligence and the Design of Expert Systems, Redwood City, California: The Benjamin/Cummings Publishing Company, Inc.
Manning Ch.D., Schütze H. 2002: Foundations of statistical natural language processing, ACM SIGMOD Record 31(3), 37, <http://doi.org/10.1145/601858.601867>.
Miller R. 1966: Proces wychowania i jego wyniki [The upbringing process and its results], Warszawa: Biblioteka Nauczyciela PZWS.
Muszyński H. 1972: Ideał i cele wychowania [The ideal and goals of upbringing], Warszawa: Biblioteka Nauczyciela PZWS.
Nisbet R., Elder J., Miner G. 2009: Handbook of Statistical Analysis and Data Mining Applications, Burlington, MA: Academic Press (Elsevier).
Rutkowski L. 2006: Metody i techniki sztucznej inteligencji, Warszawa: Wydawnictwo Naukowe PWN.
Rzechowska E. 2004: Potencjalność w procesie rozwoju. Mikroanaliza konstruowania wiedzy w dziecięcych interakcjach rówieśniczych, Lublin: Wydawnictwo KUL.
Rzechowska E. 2011a: Dojrzały pracownik na rynku pracy. Jak zabezpieczyć przed wykluczeniem społecznym osoby 50+?, Lublin: Wydawnictwo Lubelskiej Szkoły Biznesu.
Rzechowska E. 2011b: Podejście procesualne. Warianty badań nad procesami w mikro- i makroskali, Roczniki Psychologiczne 14(1), 127–157.
Sośnicki K. 1966: Istota i cele wychowania [The essence and goals of upbringing], Warszawa: Nasza Księgarnia.
Spärck Jones K. 1972: A Statistical Interpretation of Term Specificity and its Retrieval, Journal of Documentation 28(1), 11–21, <http://doi.org/10.1108/eb026526>.
Szymańska A. 2011: Parental Stress in an Upbringing Situation and Giving Children Help: A Model of the Phenomenon, International Journal of Interdisciplinary Social Sciences 6(3), 141–153.
Szymańska A. 2012a: Parental Directiveness as a Predictor of Children’s Behavior at Kindergarten, Psychology of Language and Communication 16(3), 1–24.
Szymańska A. 2012b: Doświadczanie trudności w sytuacji wychowawczej a reprezentacja dziecka w umyśle rodzica: model zjawiska, Psychologia Rozwojowa 17(4), 79–91.
Szymańska A. 2015: Wykorzystanie algorytmu Text Mining do analizy przyjmowanych przez rodziców celów wychowawczych, Warszawa: XXIV Konferencja Psychologii Rozwojowej.
Szymańska A. 2016: Przejście od danych jakościowych do ilościowych — aplikacja algorytmu Text Mining do budowy modeli SEM, XXV Jubileuszowa Ogólnopolska Konferencja Psychologii Rozwojowej, Kraków: XXV Jubileuszowa Ogólnopolska Konferencja Psychologii Rozwojowej.
Tarwacka-Odolczyk A., Tomaszewski P., Szymańska A., Bokus B. 2014: Deaf children building narrative texts. Effect of adult-shared vs. non-shared perception of a picture story, Psychology of Language and Communication 18(2), 149–177.
Torebko K., Szymańska A. 2015: Zastosowanie algorytmu Classification & Regression Tree (C & RT) do wyjaśnienia relacji pomiędzy błędami wychowawczymi popełnianymi przez rodziców a rozwojem kompetencji emocjonalnych dzieci w wieku wczesnoszkolnym, Warszawa: XXIV Konferencja Psychologii Rozwojowej.
Ważyńska A., Szymańska A., Bartczak M., Bokus B. 2015: Przy okrągłym stole dialogowego Ja. Gdzie siedzi sceptyk?, [w:] Bokus B., Kosowska E. (red.), O wątpieniu, Piaseczno: Studio Lexem, 63–82.
Yim H.Y.B., Boo Y.L., Ebbeck M. 2014: A Study of Children’s Musical Preference: A Data Mining Approach, Australian Journal of Teacher Education 39(2), 21–34. Żurada J., Barski M., Jędruch W. 1996: Sztuczne sieci neuronowe. Warszawa: Państwowe Wydawnictwo Naukowe.