Plop,
Je précise que j'ai des notions en statistiques et en data science mais que ça remonte à loin et j'ai jamais touché les séries temporelles
Dans mon problème je cherche à prédire la valeur d'une information (présence: 1 ou absence: 0). J'effectue donc plusieurs mesures dans le temps (plusieurs fois dans la journée pendant des jours).
Si on découpe ça en minute, on a donc une liste (x,y) avec 3 valeurs possibles y pour chaque minute x: 1,0 et non défini (nous n'avons pas effectué de mesure).
La problématique est abstraite mais interessante: On veut effectuer une opération, mais il faut que pendant toute l'opération (qui peut durer N minutes) la valeur doit être 1, sinon l'opération est annulée et donc il y a cout associé à cela, quand bien même il resterait qu'une seule minute et qu'à la dernière minute la valeur change.
Il faut donc que je puisse prédire les intervalles suffisamment grand pendant lesquels la valeur ne change pas. Pour des raisons de cout, on ne peut pas avoir des données pour chaque minute pour chaque jour pendant des mois.
Sur quel piste partir d'après vous ?
Je pensais partir sur cela de façon naïve:
1) On rabat les données journalières sur un seul jour
2) Soit T la durée de l'opération
3) On fait glisser T minute par minute, de 00h00 jusqu'à 23h59.
4) On sélectionne comme candidats les intervalles ayant la meilleure mesure (on pourrait définir comme mesure le nombre mesure positive effectuée)
Mais cette approche ne prend pas en compte quelque chose: Un intervalle "positif" qui démarre juste après un intervalle négatif est un moins bon candidat qu'un intervalle positif situé entre 2 intervalles négatifs.
Voila voila, merci d'avance pour votre aide
Je rajoute qu'on fait l'hypothèse que le comportement réel du système est le même d'un jour à l'autre, d'où le fait que l'on puisse rassembler sur une seul journée des données historiques de plusieurs semaines
est-ce que tu peux interpoler ?
si tu as 1 1 1 1 1 ND 1 1 1 1
tu peux supposer que ND donnerait 1 s'il était mesuré ?
si oui il te faut une durée maximale réglable pour l'interpolation et simplifier le problème
Le 31 mai 2023 à 19:41:17 :
est-ce que tu peux interpoler ?si tu as
1 1 1 1 1 ND 1 1 1 1
tu peux supposer que ND donnerait 1 s'il était mesuré ?si oui il te faut une durée maximale réglable pour l'interpolation et simplifier le problème
Le 31 mai 2023 à 19:41:17 :
est-ce que tu peux interpoler ?si tu as
1 1 1 1 1 ND 1 1 1 1
tu peux supposer que ND donnerait 1 s'il était mesuré ?si oui il te faut une durée maximale réglable pour l'interpolation et simplifier le problème
Oui, dans ce genre de cas on peut interpoler
Quelles données tu utiliserais pour prédire la présence de l'objet? Des informations d'un senseur, ou bien juste la liste historique de (1/0/ND) pour chaque minutes pendant x journées?
Dans le second cas, tu pourrais rabattre tes données historiques sur une journée, que tu découpes en minutes. Le compte des objets présents pour chaque minute de la journée te donne une distribution empirique de la présence d'objet sur le temps.
Grâce à cette distribution, tu peux assigner un score à tous les intervalles de temps N, qui correspond à la probabilité qu'il y ait bel et bien un objet présent tout le long. Puis tu sélectionne le meilleur / celui que tu préfères.