quinta-feira, 1 de julho de 2010

A propósito de exames finais nacionais (2)


Neste segundo texto sobre os exames finais nacionais abordava um pouco mais demoradamente as características do exame final que fazem dele um mau instrumento de avaliação do desempenho dos alunos. Na altura, realçava que a selectividade do exame final nacional era usada para condicionar o número dos que concluíam o ensino secundário, limitando a pressão sobre o mercado do emprego ou sobre o ingresso no ensino superior; ou que a sua conjugação com a restrição do número de vagas abertas no ensino superior público era usada para encaminhar os menos afortunados para o ensino superior privado, carente de alunos como de pão para a boca. Não se colocava, então, o caso, ainda mais escandaloso, da utilização da selectividade do exame para facilitar a conclusão dos níveis de ensino em que fosse aplicado.

É claro que a avaliação interna praticada nas escolas, quando deixada ao critério de cada um dos docentes, sem grande formação específica, sem apoio em instrumentos de avaliação aferidos e sem controlo do grupo de docência, corre o risco de produzir efeitos nefastos. Para que esses efeitos fossem similares aos que podem ser produzidos pelo exame final nacional, porém, seria necessário que todos os professores praticassem uma avaliação não fiável, o que é muito improvável. Sem qualquer margem para dúvida, porém, esses efeitos são mais facilmente provocados por um instrumento de avaliação comum ao universo dos alunos do que pelos múltiplos instrumentos de avaliação utilizados pelos milhares de professores que nas escolas avaliam os desempenhos dos alunos sobre os mesmos conteúdos.

Com a persistência das elevadas taxas de insucesso escolar com que nos vemos confrontados, a utilização de um instrumento de avaliação que produz efeitos amplificados, porque aplicado ao universo dos alunos, pode contribuir para mascarar a má qualidade das aprendizagens escolares e, deste modo, para melhorar as malfadadas estatísticas do insucesso. Nos tempos que correm, em que a ética anda pelas ruas da amargura, o risco de que tal aconteça é bem real. Bastará ir baixando o grau de selectividade e ir aumentando o factor de moderação na avaliação final. Suavemente, sem que nos demos conta, e dissimuladamente, escudada na tão afamada validade dos exames finais nacionais. Para consolo dos incautos e preocupação dos avisados.


*


PARA QUE SERVEM OS EXAMES?


Ocorrências insólitas na realização recente dos exames finais nacionais do ensino secundário mantêm actual uma abordagem mais demorada do discurso retórico e das práticas simbólicas usados para justificá-los como instrumento de avaliação da aprendizagem de programas longos de sistemas de ensino de acesso automático ou aberto.

Pela forma de que se reveste — prova, geralmente, verbal (escrita ou escrita e oral), prestada num tempo curto, nas mesmas condições e idêntica para todos os que se pretende avaliar quanto à detenção de determinadas competências — o exame é um instrumento de avaliação restrito — geralmente, só permite avaliar competências das categorias taxonómicas mais baixas do domínio cognitivo (a memorização, a compreensão e, por vezes, a aplicação); arbitrário — a selecção de objectivos e de conteúdos e a estrutura e cotação da prova são descontextualizadas, os critérios de correcção são latos e os enviesamentos não são moderados; e aleatório — as condições da sua prestação induzem ansiedades limitadoras do desempenho, que perturbam os resultados individuais e podem produzir injustiças pessoais. A consistência e a validade do exame para a avaliação da aprendizagem são, assim, muito limitadas.

Por outro lado, o exame também não visa regular o processo de ensino-aprendizagem (detectando e identificando desadaptações de metodologias de ensino ou dificuldades de aprendizagem), como o faz a avaliação formativa; nem controlar o processo e o produto final global, como o faz a avaliação contínua (sistemática, multi-instrumental, globalizante e cumulativa); mas apenas tem em vista controlar o produto após o fim do processo, seleccionando quem tem, ou não tem, sucesso. A consistência e a validade do exame para a regulação e a melhoria da qualidade do processo de ensino-aprendizagem são, portanto, nulas.

Apesar de não contribuir para regular ou, sequer, para controlar o processo de ensino-aprendizagem, por lhe ser exterior; de restringir as competências avaliadas às categorias mais baixas do domínio cognitivo; de introduzir a aleatoriedade nos resultados do desempenho; o exame, pela margem de arbítrio com que pode ser elaborado, permite controlar a selectividade e, deste modo, a mobilidade e a distribuição dos alunos pelos níveis de ensino, determinando o acesso aos níveis mais elevados de escolaridade e aos consequentes benefícios sociais. Mas mesmo a fiabilidade com que desempenha esta função é muito discutível.

Sintomaticamente, no discurso retórico que suporta o exame, esta sua função principal — seleccionar e controlar a mobilidade — é pouco ou raramente referida. Esse discurso escamoteia as limitações da consistência, da validade e da fiabilidade do exame, tornando-as indiscutíveis, e atribui-lhe outros predicados ainda mais duvidosos, mas de significado mais facilmente deformável.

A modalidade de avaliação dos alunos adoptada pela reforma baseia-se numa grande diversidade de dados significativos, recolhidos por múltiplos instrumentos (testes, provas, registos, observações, etc.); é globalizante, abrange competências relevantes dos domínios cognitivo, afectivo e motor; é sistemática, desenrola-se ao longo de todo o programa; é cumulativa, reflecte os progressos da aprendizagem; e, em muitos casos, é moderada por consensos atenuadores dos enviesamentos introduzidos pelo professor. Infelizmente, esta avaliação, designada vulgarmente por avaliação contínua, é ainda exterior ao processo de ensino-aprendizagem e a sua função, tal como a do exame, é o controlo dos produtos da aprendizagem e a selecção dos alunos. Aliás, ela foi introduzida nos sistemas educativos para substituir o exame precisamente porque constituía um instrumento de avaliação mais consistente e de maior validade, e produzia uma selecção mais fiável, permitindo abranger competências mais variadas, ultrapassar a aleatoriedade do resultado da prova terminal única e reduzir o arbítrio do avaliador e os enviesamentos do corrector, limitações de longa data reconhecidas ao exame pela docimologia.

Esta modalidade de avaliação efectuada nas escolas mantém em aberto alguns problemas deontológicos — desde logo, acerca da função que desempenha — e outros, de natureza técnica — nomeadamente, a correspondência entre as competências avaliadas pelos professores e as socialmente pretendidas, o rigor da aferição e os níveis de proficiência exigíveis — problemas fracamente debatidos e nunca explicitados pela administração educativa. Em vez de incentivar o debate, de promover a formação e de explicitar devidamente as características pretendidas, tendo em vista melhorar a consistência, a validade e a fiabilidade da avaliação praticada, a administração educativa resolveu moderá-la pelo exame, invocando como justificação um conjunto de argumentos tão frágil quanto falacioso.

Um desses argumentos é o de que o exame contribuiria para a promoção da equidade da avaliação e da qualidade da educação escolar. Ora, um mau instrumento de avaliação não promove a equidade da avaliação só porque sujeita todos às mesmas condições de prestação; e um instrumento de selecção dos alunos não promove a qualidade da educação escolar, dado que não intervém na regulação do processo de ensino-aprendizagem. Um bom instrumento de selecção (como a avaliação contínua) também não promove a qualidade da educação escolar, mas pode produzir uma selecção fiável; o exame, nem isso. O exame induz em professores e alunos a adopção de estratégias de adaptação; nos alunos, a ansiedade pelo receio do risco da arbitrariedade e da aleatoriedade obriga-os à auto-formação, ao estudo concentrado nos conteúdos de exame rotineiros (vulgo "marranço"), à "explicação" para o exame, etc. — aprendizagens intensivas que em adolescentes imaturos não ultrapassam a memória de curto prazo e não podem confundir-se com qualquer melhoria da qualidade da educação escolar (quer porque lhe são exteriores, quer porque se restringem ao treino da memória ou da resolução de problemas estereotipados); e, nos professores, condu-los a reinterpretações restritivas do currículo e dos objectivos programáticos e à orientação da docência para a preparação para o exame. A qualidade da educação escolar corre, assim, sérios riscos de piorar, independentemente das classificações médias dos exames.

Outro dos argumentos é o de que o exame contribuiria para a homogeneização das classificações. Sendo a população escolar que se submete a exame heterogénea e diferenciada pelas classificações da avaliação contínua, não se vislumbra por que virtuosismo o exame contribuiria para tornar homogéneo o que o não é. Como prova única, o exame unifica os objectivos e os conteúdos seleccionados, a estrutura, a cotação, o formato e as condições de prestação, eliminando a diversidade local e contextual, mas não homogeneíza nada, nem sequer os enviesamentos de correcção (dada a latitude dos critérios e a multiplicidade dos correctores). E a unificação das provas nem é sinónimo da sua qualidade (que engloba as validades de conteúdo e científica, a fidelidade e a selectividade); por se aplicar à totalidade do universo dos alunos, apenas produz efeitos amplificados.

Curiosamente, a administração educativa, que se afirma tão preocupada com a qualidade da educação, afinal, preocupa-se pouco com a qualidade das provas, e mesmo quando ela tem repercussões na opinião pública, como ocorreu com os erros científicos e a elevada selectividade de algumas provas dos recentes exames finais nacionais, tudo faz para a tornar inquestionável. Num primeiro tempo, esforçou-se por minimizar a taxa de selectividade (que até nem seria muito diferente da verificada nas provas específicas... mesmo que agora tivesse função diferente!) e o efeito que nela teriam tido os erros científicos detectados; depois, levianamente, optou por atribui-la à má qualidade das aprendizagens escolares (e, implicitamente, à irresponsabilidade dos professores e à preguiça dos alunos), que os exames teriam diagnosticado com rigor, elidindo completamente qualquer relação com a falta de validade de conteúdo das provas, que o número inusitado de erros científicos faria, pelo menos, suspeitar.

Outro argumento, ainda, é o de que o exame permitiria controlar o cumprimento dos programas (objectivo da anterior administração educativa, sem se preocupar com a exequibilidade desse cumprimento...). O cumprimento dos programas ou, pelo menos, a leccionação dos conteúdos correspondentes aos objectivos essenciais é um direito dos alunos e das famílias, e uma obrigação da administração; é também uma condição prévia, que determina, em parte, a validade da avaliação, que faz parte das regras do jogo e não do seu resultado. Tal como não teria validade avaliar com base em conteúdos não essenciais, não significativos ou não representativos (e, na esmagadora maioria dos casos, os programas não identificam os que o são), também não teria validade avaliar com base em conteúdos não leccionados (por inexequibilidade devida a excessiva extensão ou a contingências locais justificadas). O exame, como prova unificada não contextualizada, introduz esse risco que lhe fere a validade. O mais grave, porém, é pretender-se controlar o cumprimento dos programas através de um instrumento para avaliar alunos! É penalizá-los duplamente — por não lhes ter sido leccionada a totalidade dos programas e por serem avaliados sobre conteúdos não leccionados. Digamos que é um pouco macabro. Além do mais, quando a administração educativa tem prevista, para esse efeito, uma outra avaliação (impropriamente designada por avaliação aferida) e outras formas de controlo sistemático, internas ou externas às escolas, que nestes três anos não foram usadas ou não foram suficientemente divulgadas.

Por fim, no rol dos argumentos, o exame é apontado como instrumento da manutenção da confiança social no sistema educativo. Não se sabem os significados concretos desta confiança, e a administração nunca os explicitou, pelo que não é fácil identificar quais os predicados do exame que contribuiriam para o quê. Aventemos alguns, plausíveis: a igualdade formal (conteúdos e condições de prestação idênticas para todos), em que assenta a filosofia do sistema de currículo único; o rigor nas condições de prestação (o sigilo das provas, a vigilância apertada, o anonimato perante o corrector), que dissuadiria estratégias de engano e favorecimentos, mas não é confundível com rigor da avaliação; e a produção duma selectividade de intervalo pré-definido, socialmente aceitável. Ora, estes predicados não são exclusivos do exame nacional, que apenas os unifica e controla centralmente, com custos (de toda a ordem) não desprezáveis.

A "necessidade" de unificação e de controlo centralizado — solenizada por um folclore simbólico ritualizado (com provas guardadas em esquadras de polícia e transportadas com escolta policial, instruções rígidas e fiscalização apertada), largamente difundido, que se mostra ridículo, pelo excesso e... pela facilidade com que falha — não corresponde a qualquer situação real de corrupção generalizada da avaliação contínua descentralizada realizada nas escolas (que é fiável, salvo casos concretos ou pontuais identificáveis pela inspecção educativa, a quem competiria saná-los), mas resulta da desconfiança "natural" do Estado centralizado na muito ligeira descentralização que, de vez em quando, se vê obrigado a instituir. É, no fundo, mais um dos reflexos maniqueístas da fraqueza e da fragilidade do poder, que o faz ver em cada cidadão não uma pessoa de bem a quem deve servir, mas um potencial delinquente de quem precisa defender-se.

Entre nós, ao invés de instrumento de avaliação único decisório, o exame foi reintroduzido como moderador da avaliação contínua. Em princípio, o moderador deverá ser mais fiável do que o moderando, visto servir para lhe corrigir desvios extremos; neste caso, a fiabilidade do moderador é ainda mais duvidosa do que a do moderando. De qualquer modo, se a selectividade do exame for baixa, pode favorecer alunos medíocres e prejudicar alunos aplicados, e, em termos gerais, pouco efeito tem na moderação das classificações. Como moderador, portanto, a eficácia do exame é duvidosa e pode resultar contraproducente.

Que resta do exame? O incentivo a estratégias de adaptação ilusórias da qualidade da aprendizagem e a reserva, para a administração, da arbitrariedade na elaboração da prova, que lhe permite controlar centralmente a taxa de selectividade. Manipulando-a, o poder pode diferir de um ano, ou talvez mais, a entrada de uns milhares de jovens no mercado do emprego ou na candidatura do acesso ao ensino superior e manter as expectativas das famílias e dos alunos “tocados pelo azar”. E não é pouco. Mas as maleitas da educação escolar, que não se tratam pela avaliação e, muito menos, pelo exame, essas continuam!

A actual equipa governamental da educação não manteve o exame final nacional porque ele estava previsto e o ano lectivo já estava em curso quando tomou posse, como despudorada e desnecessariamente invocou. O regime de acesso estava na mesma situação e ela alterou-lhe totalmente as regras. Em nome da estabilidade, manteve o exame; em nome da eficiência, desestabilizou o acesso. Ela é defensora do exame, só que aparece a defendê-lo por aquilo que de há muito se sabe que ele não é — um bom instrumento de avaliação dos alunos — quando o poderia defender pelas funções políticas que (o exame) desempenha, ou, apenas, impô-lo pela legitimidade democrática que detém.

Apesar das hesitações, das inflexões contraditórias, das opções retrógradas e dos monumentais fiascos que têm caracterizado a sua acção, alguns afirmam que esta equipa governamental da educação é reconhecidamente (!) um bom grupo de técnicos; outros, que nem tanto. O certo é que este grupo de técnicos de educação vê tais méritos no exame, e tem um tal sentido da economia, que num afã de eficiência (próprio dos técnicos) e de inabilidade política aboliu as provas específicas e concentrou tudo — conclusão do secundário e acesso ao superior — num só exame. A tanto nem o PPD chegara. E, como se não bastasse, negociou a fixação de classificações mínimas de ingresso já este ano (esta, sim, medida necessária para eliminar a imoral ilegalidade de admissão com classificações risíveis, que o PPD instituíra, provavelmente por pressão do lobby do ensino superior). É claro, a amplificação dos efeitos concentrados do exame revelou-se desastrosamente excessiva.

Desta vez, para quem tanto apregoa o rigor, a solução foi expedita: um bónus (não se sabe a quê — se às suspeitas classificações internas, se às qualificadas classificações de exame; para uns insuficiente, para outros tão excessivo que leva as classificações finais a ultrapassarem o limite da escala, coisa nunca vista, mas em todo o caso arbitrário) que contraria tudo o que a administração pretendia justificar com o exame; e o recurso ao “percentil”, o expediente caricato que permitirá o ingresso no ensino superior com classificações surpreendentemente baixas. Com que autoridade a administração educativa e o ensino superior poderão falar da qualidade da educação escolar? Que credibilidade suscitam e que confiança esperam merecer dos alunos e das suas famílias? E, para o ano, que nos espera?

Impõe-se, em nome da sensatez, infelizmente, desestabilizar, de novo, o regime de acesso; em nome da lucidez, necessariamente, repensar a avaliação, sim, mas também, e antes de mais, os programas, a organização curricular, a reforma, a educação e os recursos que ela merece, enfim, a escola (eventualmente, não apenas a escola básica e secundária). Ponderada, consensual, mas decididamente, mesmo que não seja tudo para o ano, que “Roma e Pavia não se fizeram num dia”; e sem o rótulo pomposo de “reforma” e os cerimoniais que a costumam acompanhar.

Uma interrogação legítima é se será isto possível com a actual equipa governamental da educação. Os seus membros já deram provas, nesta como noutras questões, que como políticos são maus técnicos, e que como técnicos são péssimos políticos. Fica a dúvida se como técnicos serão bons técnicos, mas pouco importa. Se a política deve ser feita por bons políticos, que pode restar a quem desejar não defraudar a sua paixão? É que com uma equipa destas não são necessárias as oposições!


Almada, 08 de Setembro de 1996.

José Manuel Correia


(Texto original, que difere ligeiramente da versão publicada no jornal PÚBLICO, de 15 de Setembro de 1996, com adaptações editoriais não autorizadas, a começar pelo título ambíguo: "E se acabássemos com os exames?").