You are on page 1of 10

31

Lingwistyka Stosowana nr 4: 2011

Anna MICHOSKA-STADNIK
Uniwersytet Wrocawski

Trafno i rzetelno w badaniach glottody-


daktycznych

1. Wstp

Trafno i rzetelno s gwnymi cechami wiarygodnoci kadego badania,


a wic take badania glottodydaktycznego (GD). Nie moemy mwi o popraw-
noci i wiarygodnoci badania, jeli marna bdzie jako samych danych, a tak-
e ich analiza. Sposb traktowania tych danych powinien by peny i cisy, tzn.
wystarczajco peny i wystarczajco cisy w stosunku do potrzeb celu badania
i zwizanych z nim pyta badawczych. Ograniczenie takie bierze si z niemonoci
zapewnienia, szczeglnie w glottodydaktyce, takiej idealnej sytuacji, w ktrej gru-
pa badana i narzdzia badawcze odzwierciedlayby wszystkie aspekty procesu na-
uczania i uczenia si jzyka drugiego (N/U J2). Std te pytanie badawcze: Jak
wiek ucznia wpywa na proces N/U J2? musi pozosta bez jednoznacznej odpo-
wiedzi. Aby sprbowa na nie w peni odpowiedzie, potrzeba kilkudziesiciu na-
rzdzi badawczych, albowiem powinnimy najpierw zdefiniowa, jak rozumiemy
proces N/U J2, czyli okreli tene konstrukt w stosunku do rzeczywistoci dy-
daktycznej. Co wicej, sama zmienna wieku ucznia te wymagaaby analizy bar-
dziej szczegowej, co najmniej w trzech odrbnych grupach: dzieci, modziey
i dorosych. Z kolei sformuowanie Nauczanie sprawnoci czytania ze zrozumie-
niem nie moe by uznane za problem badawczy, poniewa jego specyfika wyma-
ga opisowego potraktowania zagadnienia, a nie rozwizania problemu. Trudno jest
wic rwnie w takim przypadku rozmawia o trafnoci i rzetelnoci w stosunku
do pyta badawczych, ktre bdzie niezwykle trudno do takiego oglnego zagad-
nienia sformuowa. Dlatego te wskazane jest, aby badacz wybra pewien wycinek
rzeczywistoci dydaktycznej, zgodnie ze swoimi realnymi warunkami i moliwo-
ciami. Dopiero wtedy moemy okreli, czy badanie takie moe by wiarygodne
i poprawne w stosunku do tego wanie wybranego wycinka rzeczywistoci. Miar
poprawnoci i wiarygodnoci badania jest stopie jego trafnoci i rzetelnoci.
32 ANNA MICHOSKA-STADNIK

2. Pojcie trafnoci

U podstaw trafnoci badania ley skojarzenie abstrakcyjnego pojcia (konstruk-


tu) z jego empirycznym przejawem. Trafno teoretyczna (ang. construct validi-
ty) okrela, na ile wskaniki (ang. exponents), odpowiadajce im narzdzia groma-
dzenia danych oraz interpretacja wynikw badania odzwierciedlaj pojcie teore-
tyczne, bdce w polu zainteresowania badacza. Dla przykadu: test teoretycznie
dotyczcy historii Europy, a w rzeczywistoci uwzgldniajcy przede wszystkim
histori Wielkiej Brytanii, nie jest testem trafnym; z kolei test teoretycznie badaj-
cy rozumienie ze suchu tekstw obcojzycznych, a w rzeczywistoci sprawdzaj-
cy rozumienie sownictwa, take nie jest testem trafnym; kwestionariusz, ktrego
celem jest zbadanie poziomu lku jzykowego w klasie, a w rzeczywistoci pytaj-
cy uczniw wycznie o atmosfer w klasie, take nie bdzie trafnym narzdziem
badawczym. Zadanie testowe na ustnym egzaminie maturalnym, ktre wymaga od
ucznia reakcji na okrelon przewidzian sytuacj jzykow, take nie jest testem
trafnym, poniewa nie sprawdza spontanicznej umiejtnoci uycia jzyka w sytu-
acjach dnia codziennego; nie jest wic to test faktycznie oceniajcy sprawno m-
wienia w jzyku obcym. Trafno samego instrumentu badawczego jest zalena od
tego, czy i w jakim stopniu narzdzie mierzy to, co powinno mierzy.
Trafno empiryczna z kolei jest przedstawiana jako cecha waciwa wska-
nikom i okrela, na ile wyczerpuj one dane zjawisko. Na przykad, wskanikami
pynnoci wypowiedzi ucznia w jzyku obcym bd: dugo frazy, dugo pauz,
liczba powtrze, liczba zawaha, liczba wypowiedzianych sylab na sekund. Nie
bd nimi na pewno liczba bdw gramatycznych i bdw w wymowie, poniewa
te ostatnie s ju wskanikami innego konstruktu, a mianowicie poprawnoci jzy-
kowej. Badacz powinien umie okreli, na ile ta pierwsza grupa wskanikw wy-
czerpuje ocen wypowiedzi i by moe doda jeszcze inne. Z kolei poziom przy-
swojenia sownictwa zostanie wyczerpany, gdy badacz zastosuje dwa wskaniki:
stopie zapamitania, czyli rozpoznania sw i ich znaczenia oraz umiejtno ich
poprawnego uycia w komunikacji ustnej i pisemnej. Zastosowanie tylko jednego
z tych wskanikw nie wyczerpuje konstruktu przyswojenia, a tylko zapamitanie
lub uycie sownictwa. Ten temat rozwija bardzo dogbnie Michel Paradis w obu
swoich ksikach (2004, 2009). Na marginesie warto wspomnie, dla uwagi po-
cztkujcych badaczy, e sownictwo ma dwojaki charakter i wymaga zaangaowa-
nia dwch rnych rodzajw wiedzy. Jeli odnosimy si tylko do odtworzenia z pa-
mici danych sw lub ewentualnego podania ich znaczenia, korzystamy wtedy
z wiedzy deklaratywnej. Natomiast jeli spodziewamy si uycia danej grupy sw
w mowie lub w pimie, mamy wtedy do czynienia z zupenie innym procesem, kt-
ry jest aktywizowany w pamici proceduralnej. O tych wanych aspektach istoty
przyswojenia sownictwa naley zawsze pamita podczas ukadania wszelkich te-
stw sprawdzajcych znajomo sw, czyli stopie ich przyswojenia. Tak wic test
typu pocz sowa z ich definicjami bdzie sprawdza konstrukt zapamitania,
a test wymagajcy napisania krtkiego tekstu z uyciem wymaganych sw, bdzie
TRAFNO I RZETELNO W BADANIACH GLOTTODYDAKTYCZNYCH 33

sprawdza umiejtno ich uycia. Najczciej, aby rzeczywicie sprawdzi stopie


przyswojenia sownictwa stosuje si oba rodzaje testw, o czym wspomniaam po-
wyej, i wtedy dopiero takie narzdzie bdzie rzeczywicie trafne.
Zoltan Drnyei (2007) pisze te o trafnoci wewntrznej i zewntrznej. Ta pierw-
sza oznacza, e wynik badania zosta ustalony na podstawie waciwych danych
i nie jest efektem zakce wynikajcych z innych czynnikw ni zmienna niezale-
na. O tych czynnikach piszemy bardziej szczegowo gdzie indziej (W. Wilczyska,
A. Michoska-Stadnik 2010), tu natomiast podam tylko kilka przykadw:
Zmiana liczby uczestnikw grupy badanej; moe wynika po prostu z nieobec-
noci uczniw na lekcji, ale take z niechci do brania udziau w samym ba-
daniu. Sytuacja taka nie musi by grona dla wiarygodnoci badania, chyba e
grupa jest niewielka i wypadnicie nawet jednego uczestnika moe ju powo-
dowa zakcenia.
Efekt nabierania dowiadczenia (praktyki); uzyskiwanie coraz lepszych wyni-
kw, zwaszcza w badaniu podunym, nie musi by koniecznie rezultatem na-
szego postpowania, ale po prostu uczniowie mog nabiera dowiadczenia w
rozwizywaniu samych testw. Bardzo czsto dostrzegamy to zjawisko pod-
czas wszelkiego rodzaju egzaminw pastwowych, np. gimnazjalnych lub ma-
turalnych. Uczniowie, ktrzy zdali egzamin maturalny na wysok ocen, bardzo
czsto nie s w stanie zrozumie wykadu z gramatyki opisowej czy literatury
angielskiej na I roku studiw anglistycznych, poniewa ich dobra ocena bya re-
zultatem nabytej umiejtnoci rozwizywania testw, a nie rzeczywistej znajo-
moci jzyka angielskiego.
Efekt dojrzewania; rozwj psychiczny i spoeczny uczniw, zwaszcza mo-
dych, daje w rezultacie coraz lepsze wyniki testw jzykowych albo coraz pe-
niejsze odpowiedzi na pytania w ankietach otwartych.
Efekt obserwatora; w obecnoci obserwatora osoby badane mog zachowywa
si inaczej, co moe zakca wyniki badania.
Efekt Hawthornea: osoba badana w obecnoci obserwatora stara si zachowy-
wa lepiej, bardziej standardowo.
Efekt aureoli: osoba badana podwiadomie spenia oczekiwania badacza, domy-
la si, co naley zrobi lub napisa, aby zadowoli osob przeprowadzajc ba-
danie, zwaszcza jeli jest to sam nauczyciel prowadzcy klas.
Badacze czsto nie s w ogle wiadomi istnienia takich czynnikw zakcaj-
cych i dobre wyniki badania przypisuj wycznie dziaaniu zmiennej niezalenej,
co jest oczywistym niedopatrzeniem.
Trafno zewntrzna dotyczy moliwoci uoglniania wynikw poza dan zbio-
rowo lub moment badania. W badaniach GD jest to rwnie utrudnione, gdy
warunki potrzebne do uoglnienia wynikw rzadko kiedy pozostaj do koca spe-
nione. Na przykad tzw. losowy dobr prby nie bdzie atwy w przypadku bada-
nia wpywu rnic indywidualnych na proces N/U J2. Ju samo istnienie rnic
indywidualnych, na przykad takich, jak tolerancja/nietolerancja wieloznacznoci,
ogranicza moliwoci losowego doboru prby. Jestemy zainteresowani uczniami
charakteryzujcymi si obecnoci lub nieobecnoci pewnej cechy indywidualnej,
34 ANNA MICHOSKA-STADNIK

a wic nie bdzie to ju prba czysto losowa, ale celowa. W przypadku chci uy-
cia typowej statystyki indukcyjnej, trudno bdzie, rozpatrujc wyniki takiego bada-
nia, uzyska ich tzw. rozkad normalny, o czym nieco wicej powiemy w dalszej
czci tego artykuu.
Podsumowujc, trafno jest zawsze rozumiana jako adekwatno czego do
czego:
konstruktu do rzeczywistoci badanej,
wskanikw (eksponentw) do konstruktu,
narzdzi badawczych do wskanikw.

3. Pojcie rzetelnoci

Rzetelno dotyczy spjnoci, czyli stopnia zgodnoci wynikw, jakie mona


uzyska za pomoc narzdzi i procedur, badajc dan grup czy populacj w r-
nych okolicznociach.
Teorie rzetelnoci rozwiny si przede wszystkim w dyscyplinach zwiza-
nych z psychologi, a podwaliny pod nie pooy Charles Spearman na pocztku
XX wieku. Rzetelno daje badaczom informacj na temat stopnia przypadkowej
niespjnoci oraz niesystematycznej fluktuacji indywidualnych wynikw w pomia-
rze. Trzeba pamita, e teoretycznie trafny pomiar jest zawsze rzetelny, natomiast
rzetelny pomiar nie zawsze musi by trafny. Inaczej mwic, narzdzie pomiaru
moe by rzetelne, ale nie musi w sposb trafny odzwierciedla danego konstruk-
tu. Szczeglnie wida to w badaniach GD, gdy np. rzekomy test na rozumienie tek-
stu ze suchu, zawierajcy elementy poprawnoci gramatycznej i leksykalnej jest
rzetelny, ale nie odzwierciedla trafnie wybranego konstruktu. Wicej na temat rze-
telnoci powiemy w konkretnych przykadach jej interpretacji w poszczeglnych
typach bada.

4. Trafno i rzetelno w badaniach ilociowych

Obserwowana czsto fascynacja badaniami ilociowymi w psychologii, peda-


gogice oraz innych naukach spoecznych przyczynia si take do ich popularno-
ci w GD. W glottodydaktyce pojawiy si jednak konkretne problemy zwizane
z aplikacj bada statystycznych, tak czsto stosowanych w opracowaniu wyni-
kw bada uwaanych za eksperymentalne. Nieobecno tzw. zera bezwzgldnego
nie pozwala, na przykad, na zastosowanie jednej ze skal porzdkowania danych,
tzw. skali rangowej. Trudno jest przecie mwi o zerowej kompetencji komunika-
cyjnej w jzyku obcym, zerowej znajomoci sownictwa lub zerowej wiedzy meta-
kognitywnej. Oprcz braku zera bezwzgldnego pojawiaj si trudnoci z uzyska-
TRAFNO I RZETELNO W BADANIACH GLOTTODYDAKTYCZNYCH 35

niem rozkadu normalnego wynikw (krzywa Gaussa) w grupie badanej. Badania


korelacyjne, w takich warunkach polegaj gwnie na okreleniu tendencji w wy-
stpowaniu badanej zalenoci pomidzy zmiennymi, ale nie s w stanie okreli
zwizku przyczynowo-skutkowego pomidzy nimi. Podobnie porwnanie rednich
statystycznych metod testu t powinno by waciwie wykonywane w warunkach
istnienia rozkadu normalnego wynikw. Pamita naley, e im wiksza grupa ba-
dana, tym wiksza szansa na uzyskanie prawidowej krzywej Gaussa. Tymczasem
w badaniach glottodydaktycznych najczciej mamy do czynienia z grup wiel-
koci klasy szkolnej, ktr okrela si jako ma lub wrcz niewystarczajc. Co
wicej, rozkad normalny wynikw w przypadku typowych testw jzykowych
z punktu widzenia nauczyciela jest wrcz niepodany. Dla nauczyciela i klasy ko-
rzystniejszy bdzie rozkad skony negatywnie (lewostronny), czyli ten z przewag
wysokich wynikw grupy. Podobnie, losowy dobr prby nie zawsze jest moliwy,
czy podany, o czym pisaam powyej.
W badaniach ilociowych przyjmuje si zazwyczaj nastpujce kryteria po-
prawnoci:
1. Rzetelno wynikw (okrelana za pomoc rnych technik, o ktrych poniej).
2. Trafno konstruktowa, czyli zaufanie do interpretacji wynikw, i faktycznie
dotyczy ona badanego pojcia.
3. Trafno badania, czyli trafno wewntrzna i zewntrzna, ktre opisane zosta-
y powyej.
Istniej trzy gwne techniki oceny rzetelnoci w badaniu ilociowym:
a. Technika powtarzania pomiaru. U jej podstaw ley przekonanie, e jeli po-
wtrzymy w tej samej grupie pomiar tym samym narzdziem po jakim okresie
czasu, powinnimy otrzyma podobne albo wrcz takie same wyniki. Odchyle-
nie wzajemne tych wynikw mierzy si za pomoc korelacji. Wspczynnik ko-
relacji powinien wtedy osign warto co najmniej 0,75, mierzony z uyciem
wzoru Cronbacha albo z uyciem wzoru r Pearsona. Wad tej techniki jest to,
e w tej samej grupie nigdy nie uda si stworzy idealnie takich samych warun-
kw w pierwszym oraz w powtrzonym pomiarze. Kady badacz powinien by
wiadomy tego, e uzyskany wynik tego samego testu moe by lepszy albo
gorszy od poprzedniego z powodw czysto pozajzykowych, np. pora dnia, po-
goda, test z innego przedmiotu tego samego dnia, wreszcie to, e badani mogli
po prostu zapamita wyniki poprzedniego testu. Natomiast rzetelno kwestio-
nariuszy mona z powodzeniem bada t technik.
b. Technika powkowa. Jest to skuteczny sposb sprawdzania rzetelnoci, zwasz-
cza testw, poniewa nie musz one by powtarzane. Wystarczy badan gru-
p podzieli na dwie czci, np. wedug numerw parzystych i nieparzystych
w dzienniku, a nastpnie obliczy wspczynnik korelacji testu w tych dwch
czciach. Istotna jest w tym przypadku ilo zada testu. Im bdzie ich wicej,
tym wspczynnik korelacji moe by wyszy.
c. Technika zgodnoci wewntrznej. Do obliczenia rzetelnoci suy w tym przy-
padku wzr Kudera-Richardsona. Okrela on, w jakim stopniu odpowiedzi po-
szczeglnych pozycji testu s zgodne z wynikiem caego testu. Poziom takiej
36 ANNA MICHOSKA-STADNIK

rzetelnoci okrela si w skali od 0 do 1; oczywicie, im bliej 1, tym wysza


jest rzetelno narzdzia badawczego. Przyjmuje si, e w taki sposb mierzo-
na rzetelno nie powinna by nisza od 0,60 (por. J. Rysiewicz 2010). Co cie-
kawe, zanim przystpi si do obliczania wspczynnika zgodnie z tym wzorem,
naley odrzuci wszystkie zadania testu, ktre byy albo za atwe albo za trud-
ne, bo na przykad wykonali je poprawnie wszyscy testowani uczniowie albo
z kolei nie wykona ich nikt. Procedury tzw. analizy jednostkowej (ang. item
analysis) mona znale w instrukcjach towarzyszcych opisowi stosowania
wzoru Kudera-Richardsona. Ju sama taka wstpna analiza jest poyteczn
wskazwk dla badacza. Jeli bowiem okae si, e 50% zada testowych zo-
stao odrzuconych ju w analizie jednostkowej, nie ma sensu wykonywanie
dalszych oblicze na przykadzie tego narzdzia, poniewa nie jest ono rze-
telne.
Osobnym problemem w badaniach wykorzystujcych kwestionariusze, a wic
przede wszystkim w badaniach ilociowych, jest uywanie narzdzi skonstruowa-
nych w innych krajach, a wic dostosowanych do innych warunkw spoecznych
i kulturowych. Czste zafascynowanie rezultatami bada przeprowadzonych w Sta-
nach Zjednoczonych czy Wielkiej Brytanii powoduje to, e polski badacz nie zwra-
ca uwagi na zupenie inny kontekst tych procedur. Przede wszystkim, s to badania
przeprowadzane na osobach uczcych si angielskiego jako jzyka drugiego, gdzie
nauczanie sformalizowane w klasie wspomagane jest znacznie poprzez obecno
jzyka angielskiego poza szko. Takich warunkw nie ma osoba uczca si tego j-
zyka w Polsce, gdzie np. jzyk angielski jest nauczany jako obcy, a nie jako drugi.
Ankiety i testy przeprowadzane wrd polskich uczniw, nawet jeli bd powiela-
y wyniki tych samych narzdzi stosowanych w krajach anglosaskich, powinny by
inaczej interpretowane, poniewa wykonywane s w zupenie innych warunkach,
w zupenie innej populacji. Co wicej, nie bd odzwierciedlay tych samych
tendencji poniewa zostay skonstruowane dla innych celw. Szczeglnie niebez-
pieczne jest bezkrytyczne stosowanie kwestionariuszy dotyczcych tzw. rnic
indywidualnych, inaczej zmiennych ucznia, czyli rnic poznawczych, emocjonal-
nych, opiniotwrczych. Takie ankiety czy testy powinny by najpierw starannie
przetumaczone na jzyk polski, potem kady punkt powinien by zweryfikowa-
ny pod wzgldem jakociowym, tzn. sprawdzony czy wyraony za jego pomoc
aspekt danego konstruktu jest zrozumiay dla polskiego ucznia, czy faktycznie da
si umiejscowi w polskiej rzeczywistoci badawczej, czy nie jest nam obcy kul-
turowo. Dopiero potem tak ankiet naleaoby sprawdzi poprzez badanie pilo-
taowe i wtedy decydowa o jej przydatnoci dla badania waciwego. Gdy takie
warunki nie zostan spenione, mona podda w wtpliwo poprawno narzdzia
badawczego, a tym samym poprawno caego badania. Dalsze wskazwki w tej
kwestii zawiera ksika J. Brzeziskiego (2002).
Na podstawie wasnego dowiadczenia z badaniami na temat stosowania stra-
tegii uczenia si, mog stwierdzi, e bardzo popularna i czsto stosowana ankieta
R. Oxford (1990) SILL (ang. Strategy Inventory for Language Learning), w swojej
czci dotyczcej uywania strategii emocjonalnych jest dla naszych uczniw obca
TRAFNO I RZETELNO W BADANIACH GLOTTODYDAKTYCZNYCH 37

kulturowo. Nie jest bowiem popularne w naszym kraju stosowanie technik relaksa-
cyjnych przed zajciami jzykowymi, przed testami czy sprawdzianami. Nie jeste-
my te przyzwyczajeni formuowa dla zachty pozytywne stwierdzenia na temat
samych siebie i swoich postpw w nauce jzyka obcego. Uczniowie poproszeni
o napisanie czego pozytywnego o sobie w takim kontekcie, przewanie poprze-
staj na jednym lub dwch zdaniach i zakopotani przyznaj si, e nic wicej nie
potrafi napisa.

5. Trafno i rzetelno w badaniach jakociowych

Wedug SAGE Research Methods Online (SRMO), trafno bada jakocio-


wych stanowi pewne wyzwanie. W badaniach ilociowych trafno okrela, na ile
wyniki adekwatnie odzwierciedlaj rzeczywisto. Natomiast w badaniu jakocio-
wym trafno oznacza stopie adekwatnoci wynikw do opisywanego kontekstu
badawczego. To oznacza, e nawet jeli nie mamy bezporedniego dostpu do ca-
oci badanej rzeczywistoci i nasze sdy mog by jednostronne, wci moemy
twierdzi, e nasze badanie jest trafne i wiarygodne, bo odzwierciedla prawdziwo
tego danego i dostpnego nam wycinka rzeczywistoci. Badanie musi by wykona-
ne zgodnie z nasz najlepsz wiedz, z uwzgldnieniem wszelkich moliwych oko-
licznoci. Niektrzy twierdz, e trafno takich bada naley bardziej rozpatrywa
w kategoriach moralnych ni epistemologicznych.
Z kolei rzetelno w badaniach jakociowych moe mie take rne interpreta-
cje. Badanie jakociowe jest rzetelne, jeli:
1. Rne techniki gromadzenia danych, np. wywiady lub obserwacje, wykazuj
istnienie podobnych lub wrcz tych samych zjawisk.
2. Dokadna replikacja badania jest niemoliwa, poniewa warunki zawsze bd
nieco inne. W zwizku z tym potrzebny jest bardzo dokadny opis sposobw
gromadzenia danych i ich szczegowa analiza.
3. Wedug niektrych badaczy, rzetelno nie musi mie okrelonego statusu
w badaniach jakociowych, poniewa i tak inny badacz zgromadzi w podobnym
kontekcie inne dane i inaczej je zinterpretuje. Tego pogldu nie podzielam, po-
niewa moim zdaniem nadmierny relatywizm nie prowadzi do niczego i negu-
je sensowno jakichkolwiek prac badawczych.
Jak mona, w takim razie, osign wiarygodno bada jakociowych i zapew-
ni ich odpowiedni trafno i rzetelno? Podam tutaj kilka moliwoci:
1. Rzetelno narzdzia badawczego okrela si poprzez zastosowanie techniki
kilku oceniajcych. Jeli oceny ich s zbiene, narzdzie jest rzetelnie zaplano-
wane. Ta uwaga dotyczy przede wszystkim takich narzdzi, jak: ankiety otwar-
te, dusze wypowiedzi ustne oraz pisemne.
2. Aby zapewni rzetelno, badanie musi by prowadzone w sposb systematycz-
ny, zwykle w okrelonych odstpach czasowych. Odstpy te nie musz by re-
gularne, lepiej jeli wyznacza je rytm, np. roku szkolnego.
38 ANNA MICHOSKA-STADNIK

3. Trzeba zapewni cigo bada z tymi samymi osobami. W przypadku nie-


wielkich grup inny skad grupy badanej moe cakowicie zmieni wyniki bada-
nia.
4. Trzeba zapewni staranny dobr osb badanych pod wzgldem celu badania.
Naley uwzgldni czynniki mogce zakci w taki czy inny sposb zbieranie
danych. Na przykad, osoby ze skonnociami do cigych artw, do fantazjo-
wania, do nieszczeroci, mog bra udzia w badaniu, ale interpretacja ich od-
powiedzi powinna uwzgldnia ich cechy osobowociowe.
5. Naley angaowa osoby badane w moliwie jak najwicej sytuacji badaw-
czych z uyciem rnych technik. Jest to tak zwana triangulacja, bardzo poy-
teczna technika, gdzie badan grup obserwuje si trzykrotnie, na rne sposo-
by (np. wywiady, obserwacja, testy).
6. W sprawozdaniu z badania autor powinien w sposb szczeglny uwydatni
te aspekty, ktre wiadcz o wiarygodnoci jego wynikw, o bezstronnoci ba-
dacza, o dojrzaoci sdw. Naley te poda wszystkie sytuacje nietypowe,
trudnoci i problemy, co uwiarygodni dany opis (W. Wilczyska, A. Micho-
ska-Stadnik 2010:141-142).
Wobec szczeglnego charakteru GD, ktrej materia badawczy nie zawsze pod-
daje si analizie ilociowej ze wzgldu na wielowymiarowo problematyki (bada-
nia ludzi w sytuacji formalnego uczenia si w klasie, zmienne warunki, problemy
z rozkadem normalnym wynikw), widzimy potrzeb uzupeniania si wzajemne-
go obu gwnych typw bada. Jak pisze K. ska (2010: 220), Niewtpliw za-
let bada poczonych jest fakt, e przyczyniaj si one do lepszego zrozumienia
zjawisk zoonych.

6. Badania mieszane

W badaniach mieszanych dominuje zasada triangulacji, poniewa w GD jako


nauce spoecznej, nie mona bezpiecznie polega na wynikach uzyskanych za
pomoc jednej tylko techniki gromadzenia danych, kojarzonej zwykle z jedn okre-
lon metodologi. Na przykad wywiad otwarty czy notatki z lekcji kojarz si
zwykle z metod obserwacji, a wic z jakociowym typem bada. Z kolei testy
czy ankiety zamknite (np. oceniane wedug skali Likerta), kojarz si z metodami
eksperymentalnymi, czyli z ilociowym typem bada. Badania mieszane, czynic
uytek z rnych sposobw gromadzenia danych i ich analizy, zwikszaj wiary-
godno otrzymanych wynikw.
Podam teraz przykad badania mieszanego z uyciem triangulacji: Chcc zba-
da postpy uczniw w przyswajaniu sownictwa jzyka obcego po wprowadzeniu
szkolenia w zakresie wykorzystania strategii pamiciowych, moemy wykorzysta
nastpujce narzdzia zbierania danych:
1. Testy rozpoznawania i uycia wybranych sw (ilociowe) przed i po szkoleniu
w zakresie strategii (postpy uczniw).
TRAFNO I RZETELNO W BADANIACH GLOTTODYDAKTYCZNYCH 39

2. Technik gonego mylenia podczas czytania tekstu obcojzycznego ze zrozu-


mieniem. Wykae nam uycie tych strategii (jakociowe).
3. Wywiad z uczniami (jakociowe) na temat przydatnoci strategii pamiciowych
w rozpoznawaniu i uywaniu sownictwa.
Oczywicie, kade z tych narzdzi wymaga osobnego podejcia do analizy otrzy-
manych danych.
Podam teraz przykady bada poczonych, ktrych jest 4 rodzaje (por. SAGE
Research Methods Online). Kursyw zaznaczono badanie, ktre ma przewag, to
znaczy jest bardziej dogbnie wykorzystane do realizacji danego celu badawczego.
Badanie zapisane zwykym drukiem jest badaniem pomocniczym. Kolejno wyko-
nywania dziaa badawczych zaley od celu badania.
1. Jakociowe/ ilociowe. Badacz prowadzi wywiad potwarty, ktrego celem jest
wybranie konkretnych problemw do opracowania w ankiecie zamknitej, kt-
ra bdzie potem analizowana z wykorzystaniem statystyki (np. sposoby uczenia
si sownictwa/ ankieta szczegowa na temat stosowanych strategii).
2. Ilociowe/ jakociowe. Przeprowadzamy kwestionariusz, na podstawie ktrego
wybieramy jednostki o szczeglnych cechach charakterystycznych, ktre potem
poddaje si intensywnej obserwacji (np. na podstawie ankiety dotyczcej stop-
nia tolerancji wieloznacznoci wybieramy jednostki ze szczeglnie niewielk
tolerancj i obserwujemy ich postpy w mwieniu w jzyku obcym).
3. Ilociowe/ jakociowe. Kwestionariusze wskazuj na istnienie pewnych zale-
noci pomidzy zmiennymi. Nastpnie jest prowadzona obserwacja lub wywiad
otwarty celem zbadania czynnikw, ktre mog by odpowiedzialne za t zale-
no (np. kwestionariusz i test wykazay, e uczniowie z ma tolerancj wielo-
znacznoci maj problemy z gramatyk J2. Obserwacja wskazuje na dodatkowe
czynniki, np. niepewno, uzalenienie od jzyka ojczystego).
4. Jakociowe/ ilociowe. W obserwacji wida wystpowanie pewnych interesu-
jcych zalenoci. Badanie ankietowe ma na celu uchwycenie, na ile te zale-
noci wystpuj systematycznie (np. zaobserwowano, e osoby ciche i spo-
kojne czytaj lepiej w J2. Test na introwersj i na czytanie ze zrozumieniem,
skorelowane ze sob, by moe poka systematyczn zaleno pomidzy
tymi zmiennymi).
Korzyci wynikajce z podejcia mieszanego s niewtpliwe, co wykazane zo-
stao na przykadach. Obie tradycje badawcze reprezentuj, co prawda, odrbne
podejcia do rzeczywistoci: (a) ilociowe: pozytywizm i obiektywizm; (b) jako-
ciowe: interpretacyjno i konstruktywizm, ale dopiero razem daj one najbardziej
adekwatny obraz rzeczywistoci badanej.
Niektrzy uwaaj, e nie powinno si tych bada czy. Niemniej jednak,
w GD wiele mona osign w rezultacie poczenia mocnych stron obu tradycji
badawczych, co wie si z pewnoci ze zwikszonymi kosztami, wikszym zaan-
gaowaniem badacza, ale warto takich bada nie ulega wtpliwoci. Z pewnoci
wiksza bdzie ich wiarygodno i poprawno.
40 ANNA MICHOSKA-STADNIK

BIBLIOGRAFIA

BRZEZISKI J. (2002), Metodologia bada psychologicznych. Warszawa: PWN.


DRNYEI Z. (2007), Research Methods in Applied Linguistics. Oxford: Oxford University Press.
SKA K. (2010), Zalety stosowania poczonych metod badawczych w analizie interakcji na lek-
cjach jzyka obcego, (w:) Neofilolog, 34 (2010), 217-228.
OXFORD R. (1990), Language learning strategies: What every teacher should know. Boston, M.A.:
Heinle.
PARADIS M. (2004), A Neurolinguistic Theory of Bilingualism. Amsterdam/Philadelphia: John Ben-
jamins.
PARADIS M. (2009), Declarative and Procedural Determinants of Second Languages. Amsterdam/
Philadelphia: John Benjamins.
RYSIEWICZ J. (2009), Uchybienia metodologiczne w badaniach ilociowych w jzykoznawstwie sto-
sowanym, (w:) Neofilolog, 32 (2009), 177-188.
SAGE Research Methods Online (2010), Encyclopedia of Social Science Research Methods. DD:
20.12.2010.
WILCZYSKA W., MICHOSKA-STADNIK A. (2010), Metodologia bada w glottodydaktyce.
Wprowadzenie. Krakw: AVALON/ Flair.

Validity and reliability in second/foreign language acquisition research

For years second language acquisition (SLA) studies have been using research methods originally
employed in other social sciences, e.g. in psychology and sociology. A unique character of SLA inves-
tigations, resulting from their specific conditions and actions (i.e. researching language skills versus
knowledge), allowed for a number of developments in research methods, especially in the area of
validity and reliability of their procedures and instruments. Statistical measures, exceptionally popular
about ten years ago, appeared to be not fully adequate to give a true picture of the complex process
of language acquisition and its variables. What is proposed nowadays are mixed research types, both
qualitative and quantitative, successfully applying instruments appropriate for each type respectively.
Consequently, the problem of research credibility should be considered with more attention. The con-
cepts of validity and reliability of research studies and instruments should be regarded from both the
qualitative and quantitative perspective. Each research type requires a different approach to these two
basic constructs, and studies of mixed character will have to make an adequate use of qualitative and
quantitative interpretations of validity and reliability.

You might also like