Így növeli a gépi tanulás Siri pontosságát a HomePodban

Megjelent a macOS Tahoe 26.2 – Keretfény a videohívásokhoz, egyéb funkciók, hibajavítások, biztonsági frissítések

Megjelent a visionOS 26.2 – Utazási mód autóban és buszokon, egyéb funkciók, hibajavítások, biztonsági frissítések

Megjelent a tvOS és HomePod Software 26.2 – Apple TV app profilok, gyermek profilokkal, Apple-fiók nélkül is

Megjelent a watchOS 26.2 – finomítások az alvási pontszám kapcsán és 17 sebezhetőség javítása

Az Apple ismét közzétett egy cikket gépi tanulással foglalkozó blogján. Az Apple Machine Learning Journal legutóbbi cikke azokat a módszereket részletezi, amelyeket a HomePod használ távolabbi vagy zajos környezetben lévő beszélők hangjának felismerésére és kiszűrésére.

A főként programozókat, matematikusokat, adatelemzőket célzó írás részletekbe menően elemzi a cég audió- és beszédfelismerés csapatának mérnökei által kifejlesztett algoritmusokat. Az iDownloadBlog cikke azonban röviden összefoglalja a lényeget.

Long story short, Siri on HomePod implements the Multichannel Echo Cancellation (MCEC) algorithm which uses a set of linear adaptive filters to model the multiple acoustic paths between the loudspeakers and the microphones to cancel the acoustic coupling.

Azaz:

A HomePodon futó Siri lényegében az MCEC, azaz többcsatornás visszhangszűrés algoritmust futtatja. Ez lineáris adaptív szűrőket használ arra, hogy a HomePod hangszóróiból érkező nemkívánatos visszhangot leválassza a mikrofonok jeléről.

Az MCEC egy ismert technika a digitális jelfeldolgozásban. A HomePod azonban nem csak ezt használja, mivel ez az Apple cikke alapján közel sem tökéletes:

Two problems limit the MCEC from completely removing the device’s own playback signal from the microphones in practice:

Nonlinear coupling. Due to loudspeaker nonlinearity and mechanical vibrations of the devices, the entirety of the playback signal isn’t captured by the linear system model [8].

Non-unique solutions. When multichannel content is playing from the beamforming speaker array, the solution can be non-unique [9].

Magyarul:

A gyakorlatban azonban két probléma megakadályozza, hogy az MCEC teljesen kiszűrje a készülék által lejátszott zenét a mikrofonok jeléből:

Nemlineáris csatolás. A hangszórók nemlineáris viselkedése és mechanikai rezgésük miatt a lineáris modell nem képes teljesen leírni a belőlük jövő hangot.

Nem egyértelmű megoldások. Amikor több csatornán szól a zene, a modellnek több megoldása is lehet (és nem biztos, hogy pont a fizikailag ténylegesen megvalósuló megoldás fog kijönni – a szerk.)

Emiatt az Apple mérnökei kifejlesztették a saját utószűrő rendszereiket, amelyek valós időben optimalizálják a saját paramétereiket statisztika és gépi tanulás segítségével. Az egyik módszerük például az egyes hangsávok statisztikai értelmben vett “függetlenségét” (statisztikusok itt hunyják be a szemüket!) használja ki, hogy elkülönítse a beszélő hangját a háttérzajtól.

A HomePod algoritmusainak hatékonyságát meghallgatható hangmintákkal is bizonyítják, illetve a”Hey, Siri!” felkiáltás felismerésének hibáját is ábrázolták egy grafikonon. Ebből például látható, hogy amikor ketten beszélnek párhuzamosan, a házi fejlesztésű jelfeldolgozó algoritmusok 38%-ról körülbelül 8%-ra csökkentik a hibaarányt:

Aki részletesebben is érdeklődik a két fő algoritmus technikai háttere iránt, az érdekes olvasnivalónak találhatja a teljes, eredeti cikket.

[newsletter_signup_form id=11]

MacBook Air

MacBook Pro

iMac

Mac mini

Mac Studio

Mac Pro

Akciós Mac modellek

Használt Mac

Mac kiegészítők

Mac kiegészítők

iPad Pro 11" (2024)

iPad Pro 13" (2024)

iPad Air 11" (2024)

iPad Air 13" (2024)

iPad mini 7 (2024)

iPad (10.gen.)

Használt iPad

iPad kiegészítők

iPad (2021)

iPad (2021)

iPhone 16 Pro

iPhone 16 Pro Max

iPhone 16

iPhone 16 Plus

iPhone 15

iPhone 15 Plus

Használt iPhone

iPhone kiegészítők

iPhone 14 Plus

iPhone 14

Apple Watch Ultra 2

Apple Watch Series 10

Apple Watch SE (2024)

Apple Watch kiegészítők

Apple Watch kiegészítők

Apple Watch Series 9

Akciós Mac modellek

Használt Mac

Mac kiegészítők

Google Analytics Installation...

Mac kiegészítők

iPad kiegészítők

iPhone kiegészítők

Apple Watch kiegészítők

AirPods

Apple TV

AirTag

Egészség és fitnesz

Okosotthon kiegészítők

Kijelzők

Olvasd el a hozzászólásokat is

Szólj hozzá: Hozzászólok

Legfrissebb cikkek:

Őket is olvasd el:

Információk

Szolgáltatások

Kapcsolat

Kövess minket

©2007-2025 Szifon.com – Minden jog fenntartva

Development: Szifon & Papp Csaba

Információk

Szolgáltatások

Kapcsolat

Kövess minket

©2007-2025. Szifon.com – Minden jog fenntartva

Development: Szifon & Papp Csaba

Hírek, Újdonságok

Webshop