O que é o treinamento do cão operante?
Educação e Formação

O que é o treinamento do cão operante?

O que é o treinamento do cão operante?

Do reflexo condicionado clássico nomeado após IP Pavlov, esse reflexo difere por se basear na atividade proposital ativa do animal, causada por algum tipo de necessidade. E o reforço ao mesmo tempo é o resultado dessa atividade muito ativa e proposital. Enquanto no reflexo condicionado clássico, o reforço é o incondicionado, ou simplesmente o segundo estímulo.

O que é o treinamento do cão operante?

A aprendizagem operante foi descoberta pelo cientista americano EL Thorndike graças à inteligência de cães e gatos. O fato é que Thorndike, descobrindo a capacidade de aprendizagem dos animais, projetou uma gaiola especial equipada com uma porta com fechadura simples. Fechando cães e gatos nesta jaula, ele observava com a alegria saudável de um cientista enquanto seus irmãos menores aprendiam a abrir esta porta. E os irmãos e irmãs mais novos aprenderam a abrir a porta fazendo várias tentativas, algumas bem-sucedidas, outras não. Portanto, Thorndike chamou a forma de aprendizado que descobriu de “tentativa e erro”.

Um reflexo, porém, essa forma de aprendizado foi apelidada muito mais tarde por outro conhecido cientista americano, BF Skinner, que dedicou toda a sua vida científica a ela. É por isso que, entre os vários pais do reflexo operante, Skinner é considerado o principal pai. No entanto, para ser justo, notamos que, pela primeira vez no mundo, o treinamento baseado no aprendizado operante foi descrito por nosso maravilhoso treinador Vladimir Durov em seu livro “Animal Training. Observações psicológicas em animais treinados de acordo com meu método. 40 anos de experiência.” Assim, você pode ler sobre a versão russa do treinamento operante no livro de Vladimir Durov, e a versão americana do treinamento operante é bem descrita no livro “Não rosne para o cachorro!” da psicóloga e formadora Karen Pryor, que aliás também aconselho a ler.

O método geral de treinamento operante de Skinner pode ser descrito nas seguintes etapas:

  1. fase de privação. Foi assim que Skinner chamou esse estágio nos anos 30. No entanto, agora esse estágio deve ser chamado de “estágio de escolha e criação de uma necessidade básica”.

    Ao formar um reflexo condicionado operante, quase todas as necessidades conhecidas pelos cães podem ser usadas, mas Skinner usou a necessidade alimentar com mais frequência. E o significado do estágio de privação era que Skinner mal alimentava os animais por um tempo ou os deixava passar fome. Acreditava-se que o reforço alimentar só se tornava significativo para o animal e efetivo para o aprendizado quando este animal perdia cerca de 20% de seu peso vivo. Oh tempos, oh maneiras!

    O que é o treinamento do cão operante?
  2. O estágio de formação de reforço alimentar condicionado. Em sua pesquisa, Skinner usou alimentadores automáticos, cujo som deveria ser um sinal para os animais sobre o aparecimento de um pellet de ração. E isso levou tempo. A etapa foi considerada concluída quando, em resposta ao som do comedouro, o rato correu imediatamente para o comedouro.

    O que é o treinamento do cão operante?

    Na verdade, esse estágio é a formação de um reflexo sonoro condicionado clássico com reforço alimentar. Ele também serve como base para o chamado treinamento clicker – um método de treinamento que usa reforço positivo de alimentos sonoros condicionados.

    E temos que admitir que a escola de treinamento operante se distingue favoravelmente do treinamento tradicional doméstico pela atenção que o treinamento operante dá à questão do reforço. Reforço especialmente positivo e probabilístico.

  3. Estágio de formação da reação. Como modelo de comportamento, Skinner treinou seus ratos para apertar o pedal e seus pombos para bicar a chave. A formação da reação de pressionar o pedal foi realizada de uma das três formas: por tentativa e erro (formação espontânea), por formação dirigida ou sequencial e pelo método do alvo.

    A formação espontânea consistiu no fato de o animal, trafegando pela caixa de Skinner, acidentalmente pressionar o pedal e gradativamente associar o pressionamento do mesmo com a inclusão do comedouro automático.

    O que é o treinamento do cão operante?

    Durante a formação direcional, o pesquisador ligava o alimentador automático, primeiro reforçando qualquer orientação em relação ao pedal, depois aproximando-o e, por fim, pressionando-o. Por que não treinamento com clicker!

    E o método alvo era que uma bolinha de comida era colada na chave, as tentativas de arrancá-la levavam a pressionar a alavanca.

    O método moderno de treinamento operante para iniciar o comportamento desejado permite o uso de quase todos os métodos conhecidos de influenciar o animal. No entanto, é considerado ineficaz o uso de efeitos aversivos (que causam dor ou desconforto).

  4. Trazer o comportamento sob controle de estímulo ou introduzir um estímulo diferenciador. Em outras palavras, a introdução de um estímulo ou comando condicionado.

    Skinner e seus apoiadores acreditavam que a formação de uma ação e o desenvolvimento paralelo simultâneo de sua conexão com um estímulo condicionado (comando) são dois processos diferentes. E a assimilação simultânea de duas coisas diferentes complica o aprendizado. Portanto, os operantes tradicionais primeiro formam o comportamento e depois inserem o comando.

    O que é o treinamento do cão operante?

    Deve-se enfatizar que, na aprendizagem operante, um estímulo diferenciador não é, em geral, um comando em nossa compreensão. Uma equipe é como uma ordem, não é? Normalmente interpretamos desta forma. Um estímulo diferenciador é a informação de que agora a execução de um comportamento é mais eficaz e geralmente possível. Assim, o “comando” no treinamento operante tem a função de permitir e permitir que o comportamento seja realizado.

    Para ficar mais claro, vamos analisar a introdução de uma lâmpada no experimento como um estímulo diferenciador. Assim, o rato aprendeu a apertar o pedal e aperta quando quer comer. O pesquisador acende a luz por alguns segundos e cria condições nas quais pressionar o pedal somente quando a luz está acesa leva ao fornecimento de alimentação. E quando a luz apagar, por mais que você aperte, você terá uma combinação de três dedos! Ou seja, a inclusão de uma lâmpada cria, separa, distingue, diferencia diferentes condições. E o rato logo começa a entender. E como ela quer muito comer (tem uma necessidade alimentar!), Aí, ao ver a lâmpada acesa, ela corre imediatamente para o pedal e, bom, aperta! De fora, parece que a lâmpada acesa faz o rato, manda ele pisar no pedal. Mas agora você entende que não é assim. Quando a luz acende, diz: Agora você pode pisar no pedal. Se apenas!

  5. Comportamento reforçador. A consolidação do comportamento formado para a habilidade é realizada por repetição usando reforço probabilístico. Também é útil usar diferentes necessidades para isso e, consequentemente, aplicar diferentes reforços.

    A versão doméstica do método operante de treinamento, originária de Vladimir Durov, difere apenas porque permite introduzir imediatamente um estímulo executivo (comando, estímulo diferenciador, estímulo condicionado). A prática mostra que uma habilidade não é formada mais lentamente do que com uma técnica importada. E como permite eliminar uma etapa inteira, economiza tempo. Portanto, faz sentido apoiar o fabricante nacional de técnicas de treinamento!

O que é o treinamento do cão operante?

24 Setembro 2019

Atualizado: 26 de março de 2020

Deixe um comentário