Fråga: Jag vill vara säker på något, är användningen av k-korsvalidering med tidsserier okomplicerad, eller behöver man ägna särskild uppmärksamhet innan man använder den?
Bakgrund: Jag modellerar en tidsserie på 6 år (med semi-markov-kedja), med ett dataprov var 5: e minut. För att jämföra flera modeller använder jag en sexfaldig korsvalidering genom att separera data på 6 år, så mina träningssatser (för att beräkna parametrarna) har en längd på 5 år och testuppsättningarna har en längd på 1 år. Jag tar inte hänsyn till tidsbeställningen, så mina olika uppsättningar är:
- vik 1: träning [1 2 3 4 5], test [6]
- vik 2: träning [1 2 3 4 6], test [5]
- vik 3: träning [1 2 3 5 6], test [4]
- vik 4: träning [1 2 4 5 6], test [3]
- vik 5: träning [1 3 4 5 6], test [2]
- veck 6: träning [2 3 4 5 6], test [1].
Jag antar hypotesen att varje år är oberoende av varandra. Hur kan jag verifiera det? Finns det någon referens som visar tillämpligheten av k-korsvalidering med tidsserier.