Menu

Feature Analysis of Speech

Phonemes bestaan uit drie (en misschien meer) features:

Consonantal feature: the quality in the phoneme of having a consonantlike property (in contrast to vowels). Consonant betekent “spraak geproduceerd door een stop of tijdelijke stop van de adem” of “medeklinker” of “harmonieus. Het boek gaat hier verder niet op in, en het is dus een zeer vaag begrip.

Voicing: het gebruik maken van de stembanden bij het produceren van een klank. De letter ‘s’ in ‘sip’ is voiceless (geen gebruik van …), de letter ‘z’ in ‘zip’ is voiced.

Place of articulation: de plaats waar de klank geproduceerd woord door dit af te sluiten of af te schermen (met de tong).

Bilabial: lippen gesloten (bijv. letter ‘p’)

Labiodental: onderste lip tegen de ondertanden (‘f’)

Dental: tong drukt tegen de tanden (‘th’)

Alveolar: tong druk tegen de ‘alveolar’ richel net achter je boven-voortanden (‘t’)

Palatal: tong zit tegen gehemelte aan, net achter bovengenoemde richel (‘j’)

Velar: tong zit tegen achterste deel van gehemelte (velum) aan (‘k’)

Door ‘voicing’ en ‘place of articulation’ in een tabel te zetten, kan je phonemes classificeren.

Zie tabel 2.1 op blz.59 van het boek (niet echt nodig…)

Er zijn experimenten geweest naar het herkennen van features in spraak (Miller & Nicely). Ze lieten een aantal medeklinkers horen, inclusief lawaai/storing. De proefpersonen zeiden bij een ‘p’ veel vaker dat ze een ‘t’ hadden gehoord in plaats van een ‘d’. Dit komt volgens hen omdat ‘p’ en ‘t’ maar op 1 feature verschillen (place of art.), terwijl ‘p’ en ‘d’ op 2 features verschillen: place of art en voicing.

Lees meer...

Spraakherkenning hersenen

Spraak herkenning komt overeen met visuele (patroon)herkenning als we kijken naar het segmenteren van objecten die herkend moeten worden. Spraak kan echter niet zo duidelijk worden opgebroken als geschreven tekst of visuele informatie. Bij een continue stroom woorden, is het bijna onmogelijk de pauzes te horen die het eind van woorden markeren. Wij horen het in het Nederlands wel (hoewel het niet echt pauzes zijn, maar wij eigenlijk de illusie van woordbegrenzing horen), maar in een onbekende taal horen we één lange stroom klanken. Er zitten zelfs evenveel pauzes ín de woorden als tússen de woorden. Eén enkel woord kan opgebroken worden in kleine stukjes, genaamd phonemes. Een phoneme is de minimale unit van spraak wat kan resulteren in een verschil van het gesproken bericht. Voorbeeld: het woord ‘bat’ bestaat uit de phonemes ‘b’, ‘a’ en ‘t’, aangezien wanneer je elk stukje door een ander stukje (letter) vervangt, je een ander woord krijgt: ‘cat’, ‘bit’ en ‘ban’.

De Engelse spelling is zeer moeilijk, aangezien er geen perfecte ‘letter-to-sound’ correspondentie bestaat: in een andere context spreek je een letter weer net iets anders uit.

Problemen bij het herkennen van phonemes:

• Spraak is continu, dus het is moeilijk te herkennen waar een phoneme eindigt en waar de volgende begint. Vergelijk maar met (aan elkaar) geschreven tekst: waar eindigt de ene letter en begint de andere?

• Verschillende sprekers spreken dezelfde tekst (dezelfde rij phonemes) verschillend uit (zoals bij dialecten, maar zelfs ook bij hetzelfde accent).

Coarticulatie: wanneer je ‘big’ uitspreekt, is de ‘b’ net iets anders dan het uitspreken van de ‘b’ in het woord ‘bag’. De uitspraak van de ene phoneme wordt dus beïnvloedt door de context (een andere phoneme); twee phonemes mixen als het ware een beetje door elkaar heen.

Het wordt aangenomen dat spraakherkenning gebruikt maakt van een (apart) gespecialiseerd mechanisme in de hersenen. Misschien speelt (het linkerdeel van) de temporaalkwab hier een grote rol bij.

Lees meer...

Visuele patroonherkenning hersenen

Als we objecten eenmaal herkend hebben, komen we op het punt van patronen herkennen, wat gebeurd door middel van template matching. Deze theorie houdt in dat het beeld van een object naar de hersenen wordt gebracht en daar wordt vergeleken met andere patronen, genaamd templates. Het perceptuele systeem probeert dan het best passende patroon te vinden.

Een andere theorie over hoe we patronen herkennen is de feature analysis. Bij deze theorie worden stimuli gezien als combinaties van verschillende features (bv lijntjes of hoeken), die worden geanalyseerd door de hersenen. Deze features zijn makkelijker te herkennen dan templates en bovendien kan vanuit deze features makkelijk het object herkend worden (bijvoorbeeld een A bestaat uit twee schuine en een liggend streepje).

Biederman (1987) heeft een theorie bedacht over het herkennen van objecten door middel van componenten van die objecten, de recognition-by-components theory:

1 Het object wordt verdeeld in een aantal sub-objecten

2 De sub-objecten worden geclassificeerd in een bepaalde categorie. Er zijn 36 categorieën die geons worden genoemd (een afkorting van geometric ions), bv een cilinder of een piramide.

3 Als de sub-objecten geïdentificeerd zijn, kan het hele object herkend worden. Een experiment wees uit dat mensen makkelijker objecten kunnen herkennen waar segmenten (bv stukjes lijn) ontbraken dan objecten waar componenten (bv een vleugel van een vliegtuig) ontbraken.

Lees meer...

Visuele informatie verwerking hersenen

- The eye: cornea, pupil, iris, lens, retina, fovea, optic nerve

- Rods and cones

- Visual cortex

- Hubel and Wiesel: topographic and feature-oriented organization of the visual cortex

- Perceiving depth and surfaces: (monocular) texture gradient, size, interposition, contrast, clarity and brightness, shadow, (binocular) stereopsis, motion parallax (see Preece, chapter 4.2, for the cues missing in Anderson)

- Gestalt principes of organization: proximity, similarity, good continuation, closure

Op pagina 39 staat een plaatje met een schematische voorstelling van het oog met belangrijke termen erbij. Lichtenergie wordt met een fotochemicaal proces omgezet in neurale activiteit.

Dit gebeurt door staafjes en kegeltjes (rods and cones). De kegeltjes zijn vooral geconcentreerd in de fovea, een klein stukje van de retina waarop een object valt als we erop concentreren.

Lichtenergie komt vanuit de ogen via een aantal neurale paden uiteindelijk in de visual cortex, waar de visuele input verwerkt wordt. Dit gebeurt door ganglion cells, die in meer of mindere mate afvuren. Huble and Wiesel (1962) hebben uitgevonden dat er edge detectors (die positief of nagetief reageren op licht van een kant) en bar detectors (die positief of negatief reageren op licht in het midden met eromheen weinig licht of andersom). Deze detectors zijn ovaal van vorm en bestaan uit een aantal ganglion cells. Er bestaan een aantal manieren die mensen gebruiken om van een 2D beeld een 3D beeld tevormen:

- texture gradient (elementen lijken dichter op elkaar te staan als ze verder weg zijn)

- stereopsis (met het ene oog zie je de wereld net iets anders dan met het andere en zo zie je diepte)

- motion parallax (dit wil zeggen dat punten die verder weg zijn langzamer lijken te bewegen dan punten die dichterbij zijn)

- size (de grootste van twee dezelfde objecten lijkt het dichtstbij)

- interposition (als een object deels de andere overlapt lijkt die ervoor te staan)

- contrast, clarity and brightness (sherpere en duidelijke objecten lijken dichterbij te staan)

- shadow (schaduws die geworpen worden door objecten geven cues over de positie van die objecten)

Bij het herkennen van objecten gebruiken we de gestalt principles of organization:

(a) principle of proximity (elementen dicht bij elkaar zien we als units)

(b) principle of similarity (elemneten die op elkaar lijken groeperen we bij elkaar)

(c) principle of good continuation (elementen die vloeiend in elkaar overgaan zien we als een element)

(d) principle of closure (elementen die elkaar overlappen maken we in gedachten zelf af, terwijl dit helemaal niet juist hoeft te zijn)

Lees meer...

Zintuigen zien en horen hersenactiviteit

Dit hoofdstuk gaat over hoe zintuigen identificeren wat ze zien en horen. Als een persoon geen visuele objecten kan herkennen, terwijl dit niet ligt aan intellectueel verlies of beschadiging aan de zintuigen, wordt dit visual agnosia genoemd. Dit is te verdelen in apperceptive agnosia (waarbij objecten helemaal niet herkend kunnen worden; dit gebeurt vroeg in het visuele systeem) en assiociative agnosia (waarbij simpele objecten wel herkend kunnen worden en complexe objecten wel gecopieerd, maar niet herkend kunnen worden; dit gebeurt later in het visuele systeem).

Lees meer...

Methoden in Cognitieve Neuroscience

EEG = Electroencephalography = Elektro encefalogram: zorgt ervoor dat de elektrische potentialen die present zijn op de schedel vastgelegd kunnen worden. In de praktijk krijg je een pet op met vele elektronen erin bevestigd.

De elektroden registreren de veranderingen in ritmische veranderingen. Men heeft ontdekt dat (Kutas & Hillyard) er een negatieve amplitude optrad van circa 400ms als een onverwacht woord in een zin werd gehoord.

ERP = Event-related potentials zijn de EEG responsies die optreden na een bijzondere stimulus. Een ERP is handig voor tijdelijke weergave van schedelactiviteit maar maakt het moeilijk om de locatie te traceren waar de neurale activiteit, die de schedelactiviteit op gang bracht, plaatsvond

PET = Positron emission tomography

fMRI = functional megnetic resonance imaging

Beiden zijn vrij goed in het traceren van neurale activiteiten, maar relatief slecht in het meten van het tijdsverloop van de neurale activiteit Ze meten de stofwisselingsverhouding of de doorstroming van het bloed in diverse gebieden van de hersenen, er vanuit gaande dat hoe meer gebieden er actief zijn dat een groter stofwisselingsverbruik vereist.

PET gebruikt een radioactief element die geïnjecteerd wordt in de bloedbaan. De PETscanner detecteert de variaties in concentratie radioactiviteit van het element. Een aantal onderzoekers heeft hiermee de verschillende processen omtrent het lezen te lokaliseren: op deze manier kon men zien welk deel van de hersenen actief waren bij het herkennen van een woord.

fMRI geeft echter een beter ruimtelijk scheidend vermogen dan PET en is minder indringerig. Deze methode wordt nog steeds in ziekenhuizen gebruikt. fMRI gaat ervan uit dat er meer met zuurstof gevoede hemoglobine is in de buurt van een grotere neurale activiteit. Radiogolven worden getransporteerd door de hersenen die er voor zorgen dat de kern van de hemoglobine een lokaal magnetisch veldje produceert, dat door magnetische sensors die zich rond het hoofd bevinden, waargenomen kan worden. Inderdaad blijkt dat de magnetische signalen in actieve gebieden sterker is dan in inactieve.

Connectionism

Hoe kan een hoger-niveau functie worden bereikt door het verbinden van basiselementen als neurons.

Connectionism = manieren voor het verbinden van neurale elementen voor het verklaren van hoger-niveau cognitie.

PDP = Parallel Distributed Processing; ontwikkeld door McClelland en Rumelhart die ervan uitgaan dat informatie onder neurale elementen wordt gepresenteerd in activiteitspatronen.

Lees hiervoor blz 31-33 over het onderzoek van hen. Komt op volgende neer: 2 gangstergroepen met elk kenmerken, zoals leeftijdscategorie. Ieder kenmerk is als neuron opgeslagen.

Je wilt weten wie 20 of jonger is van de tweede groep: de betreffende neurons worden ingeschakeld en uiteindelijk rolt er nul of meer personen uit. Dit neuron veroorzaakt de heftigste activiteit en kan als oplossing worden gezien op de vraag. Echter als geen een aan de vraag voldoet, is er wel veel activiteit bij diegene die er het dichtst in de buurt komt en wordt als antwoord gezien. Stel dat iedereen in bepaalde leeftijd en met Y opleiding vuilnisman is geworden, dan zal bij X waarbij het niet bekend is wat hij doet, stil worden gestaan bij de vuilnisman: het systeem maakt zo vooroordelen Met dit onderzoek toonden ze aan dat: hoe neurale mechanismen onderschrijven dat iemand subtiele veroordelingen zou kunnen maken op basis van herinneringen. Dit onderzoek wordt echter wel als brug gezien van het kennis-gat tussen de hersenen en een cognitie op hoger niveau.

Lees meer...
Abonneren op deze RSS feed

Advies nodig?

Vraag dan nu een gratis en vrijblijvende scan aan voor uw website.
Wij voeren een uitgebreide scan en stellen een SEO-rapport op met aanbevelingen
voor het verbeteren van de vindbaarheid en de conversie van uw website.

Scan aanvragen