Use this url to cite publication: https://hdl.handle.net/20.500.14172/15339
Options
Ambient lighting controller based on reinforcement learning components of multi-agents
Type of publication
Straipsnis Web of Science ir Scopus duomenų bazėje / Article in Web of Science and Scopus database (S1)
Type of document
type::text::journal::journal article::research article
Author(s)
LT | ||||
LT | ||||
Dzemydienė, Dalė | Vilniaus universitetas | LT | ||
LT | Vilniaus universitetas | LT | ||
LT | Vilniaus universitetas | LT |
Title
Ambient lighting controller based on reinforcement learning components of multi-agents
Other Title
Daugelio agentų paskatos mokytis komponentais grindžiamas aplinkos apšvietimo valdiklis
Publisher
Kaunas : Technologija
Date Issued
Date Issued | Issue | Start Page | End Page |
---|---|---|---|
2012-01-14 | Nr. 5 (121) | 79 | 84 |
Is part of
Elektronika ir elektrotechnika = Electronics and Electrical engineering
Field of Science
Abstract
The paper presents a vision of sustainable eco-social laboratory, the ESLab which might be used to speed up the process of development of the recently proposed by authors of the Smart Eco-Social Apartment. It is presented the multi-agent model of the ambient comfort measurement and environment control system to be used for the development of the ESLab. The human Ambient Lighting Affect Reward index, the ALAR index is proposed at the first time used for development of the Reinforcement Learning Based Ambient Comfort Controller, the RLBACC for the ESLab. The ALAR index is dependent on human physiological parameters: the temperature, the ECG- electrocardiogram and the EDA-electro-dermal activity. The fuzzy logic is used to approximate the ALAR index function by defining two fuzzy inference systems: the Arousal-Valence System, and the Ambient Lighting Affect Reward (ALAR) System. The goal of the RLBACC is to find such the environmental state characteristics that create an optimal comfort for people affected by this environment. The Radial Basis Neural Network is used as the main component of the RLBACC to performing of two roles - the policy structure, known as the Actor, used to select actions, and the estimated value function, known as the Critic that criticizes the actions made by the Actor. The Critic in this paper was used as a value function approximation of the continuous learning tasks of the RLBACC.
Pristatoma universitetinio tipo darniosios laboratorijos ESLab vizija, kuri plėtoja neseniai autorių pasiūlyto išmaniojo ekosocialaus būsto įgyvendinimo idėją. Pateikiamas aplinkos komforto matavimo ir aplinkos kontrolės sistemos valdiklio modelis, kuris bus panaudotas ESLab plėtotei. Straipsnyje pasiūlytas žmogaus aplinkos apšvietimo efekto paskatos AAAP (ALAR) indeksas pritaikytas kuriant paskatos mokytis pagrįstąjį aplinkos komforto valdiklį ESLab laboratorijai. AAAP (ALAR) indeksas priklauso nuo žmogaus fiziologinių parametrų: temperatūros, ECG (elektrokardiogramos) ir EDA (elektrinio odos aktyvumo). Neraiškioji logika yra panaudota AAAP (ALAR) indekso funkcijai aproksimuoti, taikant dvi neraiškias išvedimo sistemas: susijaudinimo ir malonumo sistemą ir žmogų supančios AAAP (ALAR) sistemą. Sukurtojo paskatos mokytis grindžiamo aplinkos apšvietimo valdiklio PMGAAV (RLBACC) tikslas yra skatinti tokias aplinkos valdymo savybes, kurios kuria optimalų patogumą šios aplinkos paveiktiems žmonėms. Valdiklio modelis pagrįstas radialinių bazių neuroninių tinklų taikymu, realizuojant aktoriaus strategijos struktūrą tinkamiems veiksmams išrinkti ir apskaičiuojant vertės funkciją, kuri yra žinoma kaip kritikas, kuris kritikuoja aktoriaus padarytus veiksmus. Kritikas šiame straipsnyje buvo panaudotas kaip tolydžiojo PMGAAV (RLBACC) mokymosi užduočių įverčio funkcijos aproksimacija.
Is Referenced by
ISSN (of the container)
1392-1215
2029-5731
WOS
000304432600016
Scopus
2-s2.0-84863706891
eLABa
2556942
Coverage Spatial
Lietuva / Lithuania (LT)
Language
Anglų / English (en)
Bibliographic Details
7
Access Rights
Atviroji prieiga / Open Access
Journal | IF | AIF | AIF (min) | AIF (max) | Cat | AV | Year | Quartile |
---|---|---|---|---|---|---|---|---|
Elektronika Ir Elektrotechnika | 0.411 | 1.629 | 1.629 | 1.629 | 1 | 0.252 | 2012 | Q4 |
Journal | IF | AIF | AIF (min) | AIF (max) | Cat | AV | Year | Quartile |
---|---|---|---|---|---|---|---|---|
Elektronika Ir Elektrotechnika | 0.411 | 1.629 | 1.629 | 1.629 | 1 | 0.252 | 2012 | Q4 |
Journal | Cite Score | SNIP | SJR | Year | Quartile |
---|---|---|---|---|---|
Elektronika ir Elektrotechnika | 1.4 | 0.749 | 0.226 | 2012 | Q2 |