library(tidyverse)

Registered S3 methods overwritten by 'dbplyr':
  method         from
  print.tbl_lazy     
  print.tbl_sql      
── Attaching packages ──────────────────────────────────────────────────────────────────────────────────────── tidyverse 1.3.1 ──
✓ ggplot2 3.3.5     ✓ purrr   0.3.4
✓ tibble  3.1.6     ✓ dplyr   1.0.7
✓ tidyr   1.1.4     ✓ stringr 1.4.0
✓ readr   2.1.0     ✓ forcats 0.5.1
── Conflicts ─────────────────────────────────────────────────────────────────────────────────────────── tidyverse_conflicts() ──
x dplyr::filter() masks stats::filter()
x dplyr::lag()    masks stats::lag()

library(magrittr)


Attaching package: ‘magrittr’

The following object is masked from ‘package:purrr’:

    set_names

The following object is masked from ‘package:tidyr’:

    extract

library(keras)
library(tidymodels) # Or only load the 'rsample' and recipes on its own

Registered S3 method overwritten by 'tune':
  method                   from   
  required_pkgs.model_spec parsnip
── Attaching packages ─────────────────────────────────────────────────────────────────────────────────────── tidymodels 0.1.3 ──
✓ broom        0.7.9      ✓ rsample      0.1.0 
✓ dials        0.0.10     ✓ tune         0.1.6 
✓ infer        1.0.0      ✓ workflows    0.2.3 
✓ modeldata    0.1.1      ✓ workflowsets 0.1.0 
✓ parsnip      0.1.7      ✓ yardstick    0.0.8 
✓ recipes      0.1.16     
── Conflicts ────────────────────────────────────────────────────────────────────────────────────────── tidymodels_conflicts() ──
x scales::discard()        masks purrr::discard()
x magrittr::extract()      masks tidyr::extract()
x dplyr::filter()          masks stats::filter()
x recipes::fixed()         masks stringr::fixed()
x yardstick::get_weights() masks keras::get_weights()
x dplyr::lag()             masks stats::lag()
x magrittr::set_names()    masks purrr::set_names()
x yardstick::spec()        masks readr::spec()
x recipes::step()          masks stats::step()
• Use tidymodels_prefer() to resolve common conflicts.

3 Intro: Ways to create sequences…

Workshop Stock prediction

Task:

Get some stock data (tip: Use tidyquant)
- Limit yourself for now to on e stock
- Limit yourself to one variable (preferably some price data)
Develop a one-step ahead prediction of prices (or their movements)

Load some data

Select a stock abnd load the data

We will use the tidyquant package to download stock data

library(tidyquant) # My favorite package to get stock data

Loading required package: lubridate

Attaching package: ‘lubridate’

The following objects are masked from ‘package:base’:

    date, intersect, setdiff, union

Loading required package: PerformanceAnalytics
Loading required package: xts
Loading required package: zoo

Attaching package: ‘zoo’

The following objects are masked from ‘package:base’:

    as.Date, as.Date.numeric


Attaching package: ‘xts’

The following objects are masked from ‘package:dplyr’:

    first, last


Attaching package: ‘PerformanceAnalytics’

The following object is masked from ‘package:graphics’:

    legend

Loading required package: quantmod
Loading required package: TTR

Attaching package: ‘TTR’

The following object is masked from ‘package:dials’:

    momentum

Registered S3 method overwritten by 'quantmod':
  method            from
  as.zoo.data.frame zoo 
══ Need to Learn tidyquant? ═════════════════════════════════════════════════════════════════════════════════════════════════════
Business Science offers a 1-hour course - Learning Lab #9: Performance Analysis & Portfolio Optimization with tidyquant!
</> Learn more at: https://university.business-science.io/p/learning-labs-pro </>

library(timetk)

tickers = c("GME") # We can also try AAPL etc
            
data_stocks <- tq_get(tickers,
               from = "2000-01-01",
               to = "2021-11-16",
               get = "stock.prices" # What we want to get.... here prices
               )

Warning: `type_convert()` only converts columns of type 'character'.
- `df` has no columns of type 'character'

Some plots for exploration…

data_stocks %>% glimpse()

Rows: 4,975
Columns: 8
$ symbol   <chr> "GME", "GME", "GME", "GME", "GME", "GME", "GME", "GME", "GME", "GME", "GME", "GME", "GME", "GME", "GME", "GME"…
$ date     <date> 2002-02-13, 2002-02-14, 2002-02-15, 2002-02-19, 2002-02-20, 2002-02-21, 2002-02-22, 2002-02-25, 2002-02-26, 2…
$ open     <dbl> 9.625, 10.175, 10.000, 9.900, 9.600, 9.840, 9.925, 9.650, 9.700, 9.675, 9.600, 9.525, 9.725, 9.800, 9.620, 9.6…
$ high     <dbl> 10.060, 10.195, 10.025, 9.900, 9.875, 9.925, 9.925, 9.825, 9.850, 9.680, 9.725, 9.775, 9.905, 9.825, 9.715, 10…
$ low      <dbl> 9.525, 9.925, 9.850, 9.375, 9.525, 9.750, 9.600, 9.540, 9.545, 9.500, 9.550, 9.490, 9.710, 9.580, 9.600, 9.675…
$ close    <dbl> 10.050, 10.000, 9.950, 9.550, 9.875, 9.850, 9.675, 9.750, 9.750, 9.575, 9.550, 9.685, 9.850, 9.625, 9.675, 10.…
$ volume   <dbl> 19054000, 2755400, 2097400, 1852600, 1723200, 1744200, 881400, 863400, 690400, 1022800, 687800, 478400, 795200…
$ adjusted <dbl> 6.766666, 6.733002, 6.699337, 6.430017, 6.648838, 6.632006, 6.514179, 6.564677, 6.564677, 6.446849, 6.430017, …

data_stocks %>% head()

data_stocks %>% 
  plot_time_series(date, adjusted)

Registered S3 method overwritten by 'data.table':
  method           from
  print.data.table     
Registered S3 methods overwritten by 'htmltools':
  method               from         
  print.html           tools:rstudio
  print.shiny.tag      tools:rstudio
  print.shiny.tag.list tools:rstudio
Registered S3 method overwritten by 'htmlwidgets':
  method           from         
  print.htmlwidget tools:rstudio

# # ggplot alternative
# data_stocks %>%
#   ggplot(aes(x = date, y = adjusted,)) +
#   geom_line() +
#   labs(x = 'Date', y = "Adjusted Price")

Preprocessing

# Limit data
data <- data_stocks %>%
  rename(index = date, value = adjusted) %>%
  select(index, value) %>%
  arrange(index)

It is always easier to model change rather than absolute prices, so we create a variable measuring the percentage change of price instead

# Remodel value as percentage change
data %<>%
  distinct(index, .keep_all = TRUE) %>%
  tidyr::fill(value, .direction = "downup") %>%
  mutate(value = (value - lag(value,1)) / lag(value,1) ) %>%
  drop_na()

data %>%
  ggplot(aes(x = index, y = value)) +
  geom_line() +
  labs(x = 'Date', y = "Price change in pct")

data %>%
    plot_acf_diagnostics(date, value)

Train & Test split

We do a time-series split which keeps the sequencing of the data

# We use time_splits here to maintain the sequences
data_split <- data %>% initial_time_split(prop = 0.75)

data_train <- data_split %>% training()
data_test <- data_split %>% testing()

Lets see from where till when the train/test samples are

# See ehat we got
data_train %>% pull(index) %>% min()

[1] "2002-02-14"

data_train %>% pull(index) %>% max()

[1] "2016-12-06"

data_test %>% pull(index) %>% min()

[1] "2016-12-07"

data_test %>% pull(index) %>% max()

[1] "2021-11-15"

data_train %>% mutate(split = 'training') %>%
  bind_rows(data_test %>% mutate(split = 'testing')) %>%
  ggplot(aes(x = index, y = value, col = split)) +
  geom_line()

Define a reciepe

We only apply min-max scaling herewith step_range

data_recipe

Data Recipe

Inputs:


Training data contained 3730 data points and no missing data.

Operations:

Centering and scaling for value [trained]
Row arrangement [trained]

We save the min and max to rescale later again

# Preserve the values for later (to reconstruct original values)
prep_history <- tibble(
  mean = data_recipe$steps[[1]]$means,
  sds = data_recipe$steps[[1]]$sds
)

prep_history

Get processedv train & test data

We now create a x and y split. Since we here always predict the next observation, that’s easy. We will just set y= lead(x, 1)
We replace the last missing observation with the lagged value

# Number of lags
n_lag = 1

# Train data
x_train <- data_recipe %>% juice() 

y_train <- data_recipe %>%  juice() %>%
  mutate(value = value %>% lead(n_lag)) %>%
  tidyr::fill(value, .direction = "downup") 

# And the same for the test data
x_test <- data_recipe %>% bake(data_test) 

y_test <- data_recipe %>%  bake(data_test) %>%  
  mutate(value = value %>% lead(n_lag)) %>%
  tidyr::fill(value, .direction = "downup")

Transform to a 3d tensor for keras

# TRansforming the x sequence to a 3d tensor (necessary for LSTMs)
x_train_arr <- x_train %>% pull(value) %>% as.numeric() %>% array_reshape(dim = c(length(.), 1, 1))
x_test_arr <- x_test %>% pull(value) %>% as.numeric() %>% array_reshape(dim = c(length(.), 1, 1))

y_train_arr <- y_train %>% pull(value) %>% as.numeric() %>% array_reshape(dim = c(length(.), 1))
y_test_arr <- y_test %>% pull(value) %>% as.numeric() %>% array_reshape(dim = c(length(.), 1))

x_train_arr %>% dim()

[1] 3730    1    1

x_train_arr %>% glimpse()

 num [1:3730, 1, 1] -0.203 -0.204 -1.469 1.198 -0.116 ...

Setting up the LSTM

LSTM

Define model

model <- keras_model_sequential() %>%
  # LSTM layer
  layer_lstm(units = 32, 
             dropout=0.2, 
             recurrent_dropout=0.2,
             input_shape = dim(x_train_arr)[-1],
             return_sequences = TRUE) %>%
  # LSTM layer
  layer_lstm(units = 32, 
             dropout=0.2, 
             recurrent_dropout=0.2,
             return_sequences = FALSE) %>%
  # A DENSE LAYER IN BETWEEN
  layer_dense(units = 32, activation = 'relu') %>%
  #Final prediction layer
  layer_dense(units = 1, activation = 'linear')

Loaded Tensorflow version 2.7.0
2021-11-17 10:42:50.041624: I tensorflow/core/platform/cpu_feature_guard.cc:151] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  AVX2 FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.

# Compile model
model %>% 
  compile(loss = "mse", 
          metric = 'mse', 
          optimizer = optimizer_adam())

model %>% summary()

Model: "sequential"
_________________________________________________________________________________________________________________________________
 Layer (type)                                             Output Shape                                       Param #             
=================================================================================================================================
 lstm_1 (LSTM)                                            (None, 1, 32)                                      4352                
                                                                                                                                 
 lstm (LSTM)                                              (None, 32)                                         8320                
                                                                                                                                 
 dense_1 (Dense)                                          (None, 32)                                         1056                
                                                                                                                                 
 dense (Dense)                                            (None, 1)                                          33                  
                                                                                                                                 
=================================================================================================================================
Total params: 13,761
Trainable params: 13,761
Non-trainable params: 0
_________________________________________________________________________________________________________________________________

Fitting the model

Next, we can fit our LSTM using a for loop (we do this to manually reset states).
We set shuffle = FALSE to preserve sequences

hist_model <- model %>% fit(x          = x_train_arr, 
                            y          = y_train_arr, 
                            epochs     = 10,
                            verbose    = TRUE, 
                            batch_size = 64,
                            validation_split = 0.25, 
                            shuffle    = FALSE)

Epoch 1/10

 1/44 [..............................] - ETA: 2:49 - loss: 0.9618 - mse: 0.9618
17/44 [==========>...................] - ETA: 0s - loss: 1.1581 - mse: 1.1581  
30/44 [===================>..........] - ETA: 0s - loss: 1.2840 - mse: 1.2840
43/44 [============================>.] - ETA: 0s - loss: 1.0833 - mse: 1.0833
44/44 [==============================] - 4s 4ms/step - loss: 1.0756 - mse: 1.0756

44/44 [==============================] - 5s 30ms/step - loss: 1.0756 - mse: 1.0756 - val_loss: 0.7748 - val_mse: 0.7748
Epoch 2/10

 1/44 [..............................] - ETA: 0s - loss: 0.9596 - mse: 0.9596
15/44 [=========>....................] - ETA: 0s - loss: 1.2292 - mse: 1.2292
27/44 [=================>............] - ETA: 0s - loss: 1.2358 - mse: 1.2358
36/44 [=======================>......] - ETA: 0s - loss: 1.1733 - mse: 1.1733
44/44 [==============================] - 0s 5ms/step - loss: 1.0748 - mse: 1.0748

44/44 [==============================] - 0s 9ms/step - loss: 1.0748 - mse: 1.0748 - val_loss: 0.7757 - val_mse: 0.7757
Epoch 3/10

 1/44 [..............................] - ETA: 0s - loss: 0.9570 - mse: 0.9570
12/44 [=======>......................] - ETA: 0s - loss: 1.3214 - mse: 1.3214
24/44 [===============>..............] - ETA: 0s - loss: 1.0544 - mse: 1.0544
33/44 [=====================>........] - ETA: 0s - loss: 1.2418 - mse: 1.2418
44/44 [==============================] - 0s 5ms/step - loss: 1.0742 - mse: 1.0742

44/44 [==============================] - 0s 8ms/step - loss: 1.0742 - mse: 1.0742 - val_loss: 0.7770 - val_mse: 0.7770
Epoch 4/10

 1/44 [..............................] - ETA: 0s - loss: 0.9555 - mse: 0.9555
16/44 [=========>....................] - ETA: 0s - loss: 1.1910 - mse: 1.1910
32/44 [====================>.........] - ETA: 0s - loss: 1.2577 - mse: 1.2577
44/44 [==============================] - 0s 3ms/step - loss: 1.0745 - mse: 1.0745

44/44 [==============================] - 0s 7ms/step - loss: 1.0745 - mse: 1.0745 - val_loss: 0.7770 - val_mse: 0.7770
Epoch 5/10

 1/44 [..............................] - ETA: 0s - loss: 0.9538 - mse: 0.9538
 9/44 [=====>........................] - ETA: 0s - loss: 1.5461 - mse: 1.5461
19/44 [===========>..................] - ETA: 0s - loss: 1.1149 - mse: 1.1149
34/44 [======================>.......] - ETA: 0s - loss: 1.2203 - mse: 1.2203
44/44 [==============================] - 0s 5ms/step - loss: 1.0740 - mse: 1.0740

44/44 [==============================] - 0s 9ms/step - loss: 1.0740 - mse: 1.0740 - val_loss: 0.7778 - val_mse: 0.7778
Epoch 6/10

 1/44 [..............................] - ETA: 0s - loss: 0.9553 - mse: 0.9553
10/44 [=====>........................] - ETA: 0s - loss: 1.4411 - mse: 1.4411
20/44 [============>.................] - ETA: 0s - loss: 1.0731 - mse: 1.0731
32/44 [====================>.........] - ETA: 0s - loss: 1.2580 - mse: 1.2580
43/44 [============================>.] - ETA: 0s - loss: 1.0823 - mse: 1.0823
44/44 [==============================] - 0s 5ms/step - loss: 1.0746 - mse: 1.0746

44/44 [==============================] - 0s 9ms/step - loss: 1.0746 - mse: 1.0746 - val_loss: 0.7777 - val_mse: 0.7777
Epoch 7/10

 1/44 [..............................] - ETA: 0s - loss: 0.9508 - mse: 0.9508
17/44 [==========>...................] - ETA: 0s - loss: 1.1560 - mse: 1.1560
33/44 [=====================>........] - ETA: 0s - loss: 1.2422 - mse: 1.2422
44/44 [==============================] - 0s 4ms/step - loss: 1.0744 - mse: 1.0744

44/44 [==============================] - 0s 7ms/step - loss: 1.0744 - mse: 1.0744 - val_loss: 0.7781 - val_mse: 0.7781
Epoch 8/10

 1/44 [..............................] - ETA: 0s - loss: 0.9561 - mse: 0.9561
12/44 [=======>......................] - ETA: 0s - loss: 1.3166 - mse: 1.3166
21/44 [=============>................] - ETA: 0s - loss: 1.0524 - mse: 1.0524
29/44 [==================>...........] - ETA: 0s - loss: 1.2945 - mse: 1.2945
43/44 [============================>.] - ETA: 0s - loss: 1.0809 - mse: 1.0809
44/44 [==============================] - 0s 5ms/step - loss: 1.0733 - mse: 1.0733

44/44 [==============================] - 0s 9ms/step - loss: 1.0733 - mse: 1.0733 - val_loss: 0.7786 - val_mse: 0.7786
Epoch 9/10

 1/44 [..............................] - ETA: 0s - loss: 0.9443 - mse: 0.9443
12/44 [=======>......................] - ETA: 0s - loss: 1.3194 - mse: 1.3194
27/44 [=================>............] - ETA: 0s - loss: 1.2326 - mse: 1.2326
38/44 [========================>.....] - ETA: 0s - loss: 1.1413 - mse: 1.1413
44/44 [==============================] - 0s 4ms/step - loss: 1.0730 - mse: 1.0730

44/44 [==============================] - 0s 8ms/step - loss: 1.0730 - mse: 1.0730 - val_loss: 0.7800 - val_mse: 0.7800
Epoch 10/10

 1/44 [..............................] - ETA: 0s - loss: 0.9420 - mse: 0.9420
15/44 [=========>....................] - ETA: 0s - loss: 1.2291 - mse: 1.2291
24/44 [===============>..............] - ETA: 0s - loss: 1.0560 - mse: 1.0560
31/44 [====================>.........] - ETA: 0s - loss: 1.2664 - mse: 1.2664
41/44 [==========================>...] - ETA: 0s - loss: 1.1025 - mse: 1.1025
44/44 [==============================] - 0s 5ms/step - loss: 1.0750 - mse: 1.0750

44/44 [==============================] - 0s 10ms/step - loss: 1.0750 - mse: 1.0750 - val_loss: 0.7789 - val_mse: 0.7789

hist_model %>% plot()

`geom_smooth()` using formula 'y ~ x'

model %>% evaluate(x_test_arr, y_test_arr)


 1/39 [..............................] - ETA: 0s - loss: 0.6815 - mse: 0.6815
32/39 [=======================>......] - ETA: 0s - loss: 2.8909 - mse: 2.8909
39/39 [==============================] - 0s 2ms/step - loss: 9.8967 - mse: 9.8967

39/39 [==============================] - 0s 2ms/step - loss: 9.8967 - mse: 9.8967
   loss     mse 
9.89671 9.89671

Predicting Stock changes

We first predict the output of our test data

model_pred <- model %>% predict(x_test_arr) %>% as.numeric()

However, we need to rescale the output. For min-max scaling, this function will do the trick

reverse_norm<- function(x, mean, sds) {
  x_re <- (x * sds) + mean
  return(x_re)
  }

We apply it with our data and the saved min and max values from the recipe

eval <- tibble(
  index = data_test %>% pull(index),
  truth = data_test %>% pull(value),
  pred = model_pred %>% reverse_norm(x = ., mean = prep_history$mean, sds = prep_history$sds)
)

eval %>% 
  pivot_longer(-index) %>%
  ggplot(aes(x = index, y = value, col = name)) +
  geom_line()

Well… soso

Brief intro to working with time sequences and time series generators

Example timeseries:

Ok, lets take a brief look at how to work with sequention data i different ways, and prepare them as inputs for an LSTM
We, for the sake of illustration, just create a simple sequence with the numbers from 1-100 (its easier to inspect the sequence, in reality we would obviously feed it with different outputs)

data_example

  [1]   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31
 [32]  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62
 [63]  63  64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93
 [94]  94  95  96  97  98  99 100

Many-to-One predictions

In this setup, we will use several periods to predict one subsequent observations.

n_timesteps <- 10  # Define that we would like to have 5 timesteps
batch_size <- 6 # Batch size (somewhat arbitrary)
n_features <- 1 # Number of features. Since we only predict the outcome based on its own sequence, it will be 1

We will set up Keras timeseries_generator, which will feed the LSTM (or other architecture) with on-the-fly generated sequences

train_gen <- 
  timeseries_generator(
    data = data_example, # The data we will use to create the sequences.
    targets = data_example, # The putcome data, in this case the same, since we just want to predict the subsequent period
    length = n_timesteps, # How many previous steps in the sequence should be used for the prediction
    sampling_rate = 1, # Should we use every observation in the sequence or skip some?
    stride = 1, # How many steps should be skipped
    shuffle = FALSE, # Should the sequence be shuffled? In time-series prediction, we want to preserve the order of sequences, so always FALSE
    batch_size = batch_size # size of the batches generated. USe this batch size also later in the LSTM
    )

Remember, this is a lazy function, meaning it will generate the sequences on-the-fly when they are needed.
Therefore, it can not directly be inspected.

train_gen

<keras.preprocessing.sequence.TimeseriesGenerator>

However, we can extract single batches and inspect them.
This is helpful to get a feeling what the different arguments of the generator do, and to thest that they create the sequence you want.
Here, two arrrays will be returned, where the first one is the generated input sequences, the second one the corresponding output.

batch_0 <- train_gen[0]
batch_0

[[1]]
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,]    1    2    3    4    5    6    7    8    9    10
[2,]    2    3    4    5    6    7    8    9   10    11
[3,]    3    4    5    6    7    8    9   10   11    12
[4,]    4    5    6    7    8    9   10   11   12    13
[5,]    5    6    7    8    9   10   11   12   13    14
[6,]    6    7    8    9   10   11   12   13   14    15

[[2]]
[1] 11 12 13 14 15 16

# create the model
model <- keras_model_sequential()  %>%
  # Add the layer. We will make it as simple as possible here with just one LSTM and an output layer.
  layer_lstm(
    units = 32, 
    batch_input_shape  = c(batch_size, n_timesteps, n_features), # the first layer in a model needs to know the shape of the input data
    #dropout = 0.1,
    #recurrent_dropout = 0.1,
    return_sequences = FALSE, # by default, an LSTM just returns the final state
    stateful = TRUE) %>% 
  # Final output layer
  layer_dense(units = 1)

model %>% compile(loss = 'mse', optimizer = optimizer_adam(), metrics = 'mse')

length(data_example)

[1] 100

Your turn

Play a bit around with the arguments in the generator, and se what outputs it produces. This will give you some intuition
For instance, what happens if you set stride to time_p + 1 ?

Many to many predictions

In case we want to predict a sequence of several timesteps.
Unfortunately, the generator has no option for that, so we have to prepare sepperate targets on our own.
Ih wrote a handy fun ction that does so, which you can use.

# Define a function that outputs time_p timesteps for y
gen_timeseries_output <- function(data, n_timesteps_put){
  
  target <- matrix(nrow = length(data), ncol =n_timesteps_out)
  
  data <- data %>% as.numeric()
  
  for (i in 1:length(data)) {
    target[i,] <- data[(i+1):(i+n_timesteps_out)]
  }
  
  return(target)
}

Let’s try it

n_timesteps_out <- 5

outcome_sequnce <- data_example %>%
  gen_timeseries_output(n_timesteps_out)

Lets inspect

outcome_sequnce %>% head(20)

      [,1] [,2] [,3] [,4] [,5]
 [1,]    2    3    4    5    6
 [2,]    3    4    5    6    7
 [3,]    4    5    6    7    8
 [4,]    5    6    7    8    9
 [5,]    6    7    8    9   10
 [6,]    7    8    9   10   11
 [7,]    8    9   10   11   12
 [8,]    9   10   11   12   13
 [9,]   10   11   12   13   14
[10,]   11   12   13   14   15
[11,]   12   13   14   15   16
[12,]   13   14   15   16   17
[13,]   14   15   16   17   18
[14,]   15   16   17   18   19
[15,]   16   17   18   19   20
[16,]   17   18   19   20   21
[17,]   18   19   20   21   22
[18,]   19   20   21   22   23
[19,]   20   21   22   23   24
[20,]   21   22   23   24   25

Seems to produce what we want
Now we can feed that as target into the generator

train_gen_seq <- 
  timeseries_generator(
    data = data,
    targets = outcome_sequnce,
    length = 5,
  sampling_rate = 1,
  stride = 1,
  shuffle = FALSE,
  batch_size = 16
)

Error in py_get_attr_impl(x, name, silent) : 
  AttributeError: 'list' object has no attribute 'astype'

Lets instect

batch_0_seq = train_gen_seq[0]
batch_0_seq

Looks about right, dosnt it?

Multiple timesteps stoc prediction

Many-to-one

n_x <- 1 # number of features
time_x <- 4 # 4 days
time_y <- 1 # ... to predict one day ahead

# TRansforming the x sequence to a 3d tensor (necessary for LSTMs)
x_train_arr_n1 <- data_recipe %>% juice()  %>% pull(value) %>% as.matrix(ncol = time_x) %>% array_reshape(dim = c(nrow(.), ncol(.), 1))

x_test_arr_n1 <- x_test %>% pull(value) %>% as.numeric() %>% array_reshape(dim = c(length(.), 1, 1))

y_train_arr2 <- y_train %>% pull(value) %>% as.numeric() %>% array_reshape(dim = c(length(.), 1))
y_test_arr2 <- y_test %>% pull(value) %>% as.numeric() %>% array_reshape(dim = c(length(.), 1))

x <- data_recipe %>% juice()  %>% pull(value) %>% matrix(ncol = time_x)
dim(x)[2]
length(x)[2]

x_train_arr %>% dim()

x_train_arr %>% glimpse()

tsteps_x = 5
tsteps_y = 5

train_arr <- x_train %>% pull(value) %>% as.numeric() %>% matrix(ncol = (tsteps_x + tsteps_y))

x_train_arr <- train_arr[,1:tsteps_x] %>% array_reshape(dim = c(length(.), 1, 1))

#x_train %<>% pull(value) %>% as.numeric() %>% array_reshape(dim = c(length(.), 1, 1))
#x_test %<>% pull(value) %>% as.numeric() %>% array_reshape(dim = c(length(.), 1, 1))

#y_train %<>% pull(value) %>% as.numeric() %>% array_reshape(dim = c(length(.), 1))
#y_test %<>% pull(value) %>% as.numeric() %>% array_reshape(dim = c(length(.), 1))

LS0tCnRpdGxlOiAgJ1NlcXVlbmNlLTItU2VxdWVuY2UgZm9yZWNhc3RpbmcgKFIpJwphdXRob3I6ICJEYW5pZWwgUy4gSGFpbiAoZHNoQGJ1c2luZXNzLmFhdS5kaykiCmRhdGU6ICJVcGRhdGVkIGByIGZvcm1hdChTeXMudGltZSgpLCAnJUIgJWQsICVZJylgIgpvdXRwdXQ6CiAgaHRtbF9ub3RlYm9vazoKICAgIGNvZGVfZm9sZGluZzogc2hvdwogICAgZGZfcHJpbnQ6IHBhZ2VkCiAgICB0b2M6IHRydWUKICAgIHRvY19kZXB0aDogMgogICAgdG9jX2Zsb2F0OgogICAgICBjb2xsYXBzZWQ6IGZhbHNlCiAgICB0aGVtZTogZmxhdGx5Ci0tLQoKYGBge3Igc2V0dXAsIGluY2x1ZGU9RkFMU0V9CiMjIyBHZW5lcmljIHByZWFtYmxlCnJtKGxpc3Q9bHMoKSkKU3lzLnNldGVudihMQU5HID0gImVuIikgIyBGb3IgZW5nbGlzaCBsYW5ndWFnZQpvcHRpb25zKHNjaXBlbiA9IDUpICMgVG8gZGVhY3RpdmF0ZSBhbm5veWluZyBzY2llbnRpZmljIG51bWJlciBub3RhdGlvbgpgYGAKCgpgYGB7cn0KbGlicmFyeSh0aWR5dmVyc2UpCmxpYnJhcnkobWFncml0dHIpCmxpYnJhcnkoa2VyYXMpCiMgbGlicmFyeSh0aWR5bW9kZWxzKSAjIE9yIG9ubHkgbG9hZCB0aGUgJ3JzYW1wbGUnIGFuZCByZWNpcGVzIG9uIGl0cyBvd24KYGBgCgozIEludHJvOiBXYXlzIHRvIGNyZWF0ZSBzZXF1ZW5jZXMuLi4KCiMgV29ya3Nob3AgU3RvY2sgcHJlZGljdGlvbgoKVGFzazoKCjEuIEdldCBzb21lIHN0b2NrIGRhdGEgKHRpcDogVXNlIHRpZHlxdWFudCkKICAgICogTGltaXQgeW91cnNlbGYgZm9yIG5vdyB0byBvbiBlIHN0b2NrCiAgICAqIExpbWl0IHlvdXJzZWxmIHRvIG9uZSB2YXJpYWJsZSAocHJlZmVyYWJseSBzb21lIHByaWNlIGRhdGEpCjIuIERldmVsb3AgYSBvbmUtc3RlcCBhaGVhZCBwcmVkaWN0aW9uIG9mIHByaWNlcyAob3IgdGhlaXIgbW92ZW1lbnRzKQoKIyBMb2FkIHNvbWUgZGF0YQoKIyMgU2VsZWN0IGEgc3RvY2sgYWJuZCBsb2FkIHRoZSBkYXRhCgoqIFdlIHdpbGwgdXNlIHRoZSB0aWR5cXVhbnQgcGFja2FnZSB0byBkb3dubG9hZCBzdG9jayBkYXRhCgpgYGB7cn0KbGlicmFyeSh0aWR5cXVhbnQpICMgTXkgZmF2b3JpdGUgcGFja2FnZSB0byBnZXQgc3RvY2sgZGF0YQpsaWJyYXJ5KHRpbWV0aykgCmBgYAoKYGBge3J9CnRpY2tlcnMgPSBjKCJHTUUiKSAjIFdlIGNhbiBhbHNvIHRyeSBBQVBMIGV0YwogICAgICAgICAgICAKZGF0YV9zdG9ja3MgPC0gdHFfZ2V0KHRpY2tlcnMsCiAgICAgICAgICAgICAgIGZyb20gPSAiMjAwMC0wMS0wMSIsCiAgICAgICAgICAgICAgIHRvID0gIjIwMjEtMTEtMTYiLAogICAgICAgICAgICAgICBnZXQgPSAic3RvY2sucHJpY2VzIiAjIFdoYXQgd2Ugd2FudCB0byBnZXQuLi4uIGhlcmUgcHJpY2VzCiAgICAgICAgICAgICAgICkKYGBgCgoKIyMgU29tZSBwbG90cyBmb3IgZXhwbG9yYXRpb24uLi4KCmBgYHtyfQpkYXRhX3N0b2NrcyAlPiUgZ2xpbXBzZSgpCmBgYAoKYGBge3J9CmRhdGFfc3RvY2tzICU+JSBoZWFkKCkKYGBgCgpgYGB7cn0KZGF0YV9zdG9ja3MgJT4lIAogIHBsb3RfdGltZV9zZXJpZXMoZGF0ZSwgYWRqdXN0ZWQpCgojICMgZ2dwbG90IGFsdGVybmF0aXZlCiMgZGF0YV9zdG9ja3MgJT4lCiMgICBnZ3Bsb3QoYWVzKHggPSBkYXRlLCB5ID0gYWRqdXN0ZWQsKSkgKwojICAgZ2VvbV9saW5lKCkgKwojICAgbGFicyh4ID0gJ0RhdGUnLCB5ID0gIkFkanVzdGVkIFByaWNlIikgCmBgYAoKIyBQcmVwcm9jZXNzaW5nCgpgYGB7cn0KIyBMaW1pdCBkYXRhCmRhdGEgPC0gZGF0YV9zdG9ja3MgJT4lCiAgcmVuYW1lKGluZGV4ID0gZGF0ZSwgdmFsdWUgPSBhZGp1c3RlZCkgJT4lCiAgc2VsZWN0KGluZGV4LCB2YWx1ZSkgJT4lCiAgYXJyYW5nZShpbmRleCkgCmBgYAoKKiBJdCBpcyBhbHdheXMgZWFzaWVyIHRvIG1vZGVsIGNoYW5nZSByYXRoZXIgdGhhbiBhYnNvbHV0ZSBwcmljZXMsIHNvIHdlIGNyZWF0ZSBhIHZhcmlhYmxlIG1lYXN1cmluZyB0aGUgcGVyY2VudGFnZSBjaGFuZ2Ugb2YgcHJpY2UgaW5zdGVhZAoKYGBge3J9CiMgUmVtb2RlbCB2YWx1ZSBhcyBwZXJjZW50YWdlIGNoYW5nZQpkYXRhICU8PiUKICBkaXN0aW5jdChpbmRleCwgLmtlZXBfYWxsID0gVFJVRSkgJT4lCiAgdGlkeXI6OmZpbGwodmFsdWUsIC5kaXJlY3Rpb24gPSAiZG93bnVwIikgJT4lCiAgbXV0YXRlKHZhbHVlID0gKHZhbHVlIC0gbGFnKHZhbHVlLDEpKSAvIGxhZyh2YWx1ZSwxKSApICU+JQogIGRyb3BfbmEoKQpgYGAKCmBgYHtyfQpkYXRhICU+JQogIGdncGxvdChhZXMoeCA9IGluZGV4LCB5ID0gdmFsdWUpKSArCiAgZ2VvbV9saW5lKCkgKwogIGxhYnMoeCA9ICdEYXRlJywgeSA9ICJQcmljZSBjaGFuZ2UgaW4gcGN0IikgCmBgYAoKCmBgYHtyfQpkYXRhICU+JQogICAgcGxvdF9hY2ZfZGlhZ25vc3RpY3MoZGF0ZSwgdmFsdWUpCmBgYAoKCiMjIFRyYWluICYgVGVzdCBzcGxpdAoKKiBXZSBkbyBhIHRpbWUtc2VyaWVzIHNwbGl0IHdoaWNoIGtlZXBzIHRoZSBzZXF1ZW5jaW5nIG9mIHRoZSBkYXRhCgpgYGB7cn0KIyBXZSB1c2UgdGltZV9zcGxpdHMgaGVyZSB0byBtYWludGFpbiB0aGUgc2VxdWVuY2VzCmRhdGFfc3BsaXQgPC0gZGF0YSAlPiUgaW5pdGlhbF90aW1lX3NwbGl0KHByb3AgPSAwLjc1KQpgYGAKCmBgYHtyfQpkYXRhX3RyYWluIDwtIGRhdGFfc3BsaXQgJT4lIHRyYWluaW5nKCkKZGF0YV90ZXN0IDwtIGRhdGFfc3BsaXQgJT4lIHRlc3RpbmcoKQpgYGAKCiogTGV0cyBzZWUgZnJvbSB3aGVyZSB0aWxsIHdoZW4gdGhlIHRyYWluL3Rlc3Qgc2FtcGxlcyBhcmUKCmBgYHtyfQojIFNlZSBlaGF0IHdlIGdvdApkYXRhX3RyYWluICU+JSBwdWxsKGluZGV4KSAlPiUgbWluKCkKZGF0YV90cmFpbiAlPiUgcHVsbChpbmRleCkgJT4lIG1heCgpCmRhdGFfdGVzdCAlPiUgcHVsbChpbmRleCkgJT4lIG1pbigpCmRhdGFfdGVzdCAlPiUgcHVsbChpbmRleCkgJT4lIG1heCgpCmBgYAoKYGBge3J9CmRhdGFfdHJhaW4gJT4lIG11dGF0ZShzcGxpdCA9ICd0cmFpbmluZycpICU+JQogIGJpbmRfcm93cyhkYXRhX3Rlc3QgJT4lIG11dGF0ZShzcGxpdCA9ICd0ZXN0aW5nJykpICU+JQogIGdncGxvdChhZXMoeCA9IGluZGV4LCB5ID0gdmFsdWUsIGNvbCA9IHNwbGl0KSkgKwogIGdlb21fbGluZSgpIApgYGAKCiMjIERlZmluZSBhIHJlY2llcGUKCiogV2Ugb25seSBhcHBseSBtaW4tbWF4IHNjYWxpbmcgaGVyZXdpdGggYHN0ZXBfcmFuZ2VgCgpgYGB7cn0KZGF0YV9yZWNpcGUgPC0gZGF0YV90cmFpbiAlPiUKICByZWNpcGUodmFsdWUgfiAuKSAlPiUgCiAgc3RlcF9ub3JtYWxpemUodmFsdWUpICU+JQogIHN0ZXBfYXJyYW5nZShpbmRleCkgJT4lCiAgcHJlcCgpCmBgYAoKKiBXZSBzYXZlIHRoZSBtaW4gYW5kIG1heCB0byByZXNjYWxlIGxhdGVyIGFnYWluCgpgYGB7cn0KIyBQcmVzZXJ2ZSB0aGUgdmFsdWVzIGZvciBsYXRlciAodG8gcmVjb25zdHJ1Y3Qgb3JpZ2luYWwgdmFsdWVzKQpwcmVwX2hpc3RvcnkgPC0gdGliYmxlKAogIG1lYW4gPSBkYXRhX3JlY2lwZSRzdGVwc1tbMV1dJG1lYW5zLAogIHNkcyA9IGRhdGFfcmVjaXBlJHN0ZXBzW1sxXV0kc2RzCikKYGBgCgpgYGB7cn0KcHJlcF9oaXN0b3J5CmBgYAoKIyMgR2V0IHByb2Nlc3NlZHYgdHJhaW4gJiB0ZXN0IGRhdGEKCiogV2Ugbm93IGNyZWF0ZSBhIHggYW5kIHkgc3BsaXQuIFNpbmNlIHdlIGhlcmUgYWx3YXlzIHByZWRpY3QgdGhlIG5leHQgb2JzZXJ2YXRpb24sIHRoYXQncyBlYXN5LiBXZSB3aWxsIGp1c3Qgc2V0IHk9IGxlYWQoeCwgMSkKKiBXZSByZXBsYWNlIHRoZSBsYXN0IG1pc3Npbmcgb2JzZXJ2YXRpb24gd2l0aCB0aGUgbGFnZ2VkIHZhbHVlCgpgYGB7cn0KIyBOdW1iZXIgb2YgbGFncwpuX2xhZyA9IDEKCiMgVHJhaW4gZGF0YQp4X3RyYWluIDwtIGRhdGFfcmVjaXBlICU+JSBqdWljZSgpIAoKeV90cmFpbiA8LSBkYXRhX3JlY2lwZSAlPiUgIGp1aWNlKCkgJT4lCiAgbXV0YXRlKHZhbHVlID0gdmFsdWUgJT4lIGxlYWQobl9sYWcpKSAlPiUKICB0aWR5cjo6ZmlsbCh2YWx1ZSwgLmRpcmVjdGlvbiA9ICJkb3dudXAiKSAKCiMgQW5kIHRoZSBzYW1lIGZvciB0aGUgdGVzdCBkYXRhCnhfdGVzdCA8LSBkYXRhX3JlY2lwZSAlPiUgYmFrZShkYXRhX3Rlc3QpIAoKeV90ZXN0IDwtIGRhdGFfcmVjaXBlICU+JSAgYmFrZShkYXRhX3Rlc3QpICU+JSAgCiAgbXV0YXRlKHZhbHVlID0gdmFsdWUgJT4lIGxlYWQobl9sYWcpKSAlPiUKICB0aWR5cjo6ZmlsbCh2YWx1ZSwgLmRpcmVjdGlvbiA9ICJkb3dudXAiKSAKYGBgCgojIyBUcmFuc2Zvcm0gdG8gYSAzZCB0ZW5zb3IgZm9yIGtlcmFzCgpgYGB7cn0KIyBUUmFuc2Zvcm1pbmcgdGhlIHggc2VxdWVuY2UgdG8gYSAzZCB0ZW5zb3IgKG5lY2Vzc2FyeSBmb3IgTFNUTXMpCnhfdHJhaW5fYXJyIDwtIHhfdHJhaW4gJT4lIHB1bGwodmFsdWUpICU+JSBhcy5udW1lcmljKCkgJT4lIGFycmF5X3Jlc2hhcGUoZGltID0gYyhsZW5ndGgoLiksIDEsIDEpKQp4X3Rlc3RfYXJyIDwtIHhfdGVzdCAlPiUgcHVsbCh2YWx1ZSkgJT4lIGFzLm51bWVyaWMoKSAlPiUgYXJyYXlfcmVzaGFwZShkaW0gPSBjKGxlbmd0aCguKSwgMSwgMSkpCgp5X3RyYWluX2FyciA8LSB5X3RyYWluICU+JSBwdWxsKHZhbHVlKSAlPiUgYXMubnVtZXJpYygpICU+JSBhcnJheV9yZXNoYXBlKGRpbSA9IGMobGVuZ3RoKC4pLCAxKSkKeV90ZXN0X2FyciA8LSB5X3Rlc3QgJT4lIHB1bGwodmFsdWUpICU+JSBhcy5udW1lcmljKCkgJT4lIGFycmF5X3Jlc2hhcGUoZGltID0gYyhsZW5ndGgoLiksIDEpKQpgYGAKCgpgYGB7cn0KeF90cmFpbl9hcnIgJT4lIGRpbSgpCmBgYAoKYGBge3J9CnhfdHJhaW5fYXJyICU+JSBnbGltcHNlKCkKYGBgCgoKIyBTZXR0aW5nIHVwIHRoZSBMU1RNCgojIExTVE0KCiMjIERlZmluZSBtb2RlbAoKYGBge3J9Cm1vZGVsIDwtIGtlcmFzX21vZGVsX3NlcXVlbnRpYWwoKSAlPiUKICAjIExTVE0gbGF5ZXIKICBsYXllcl9sc3RtKHVuaXRzID0gMzIsIAogICAgICAgICAgICAgZHJvcG91dD0wLjIsIAogICAgICAgICAgICAgcmVjdXJyZW50X2Ryb3BvdXQ9MC4yLAogICAgICAgICAgICAgaW5wdXRfc2hhcGUgPSBkaW0oeF90cmFpbl9hcnIpWy0xXSwKICAgICAgICAgICAgIHJldHVybl9zZXF1ZW5jZXMgPSBUUlVFKSAlPiUKICAjIExTVE0gbGF5ZXIKICBsYXllcl9sc3RtKHVuaXRzID0gMzIsIAogICAgICAgICAgICAgZHJvcG91dD0wLjIsIAogICAgICAgICAgICAgcmVjdXJyZW50X2Ryb3BvdXQ9MC4yLAogICAgICAgICAgICAgcmV0dXJuX3NlcXVlbmNlcyA9IEZBTFNFKSAlPiUKICAjIEEgREVOU0UgTEFZRVIgSU4gQkVUV0VFTgogIGxheWVyX2RlbnNlKHVuaXRzID0gMzIsIGFjdGl2YXRpb24gPSAncmVsdScpICU+JQogICNGaW5hbCBwcmVkaWN0aW9uIGxheWVyCiAgbGF5ZXJfZGVuc2UodW5pdHMgPSAxLCBhY3RpdmF0aW9uID0gJ2xpbmVhcicpCmBgYAoKYGBge3J9CiMgQ29tcGlsZSBtb2RlbAptb2RlbCAlPiUgCiAgY29tcGlsZShsb3NzID0gIm1zZSIsIAogICAgICAgICAgbWV0cmljID0gJ21zZScsIAogICAgICAgICAgb3B0aW1pemVyID0gb3B0aW1pemVyX2FkYW0oKSkKYGBgCgoKYGBge3J9Cm1vZGVsICU+JSBzdW1tYXJ5KCkKYGBgCgojIyBGaXR0aW5nIHRoZSBtb2RlbAoKKiBOZXh0LCB3ZSBjYW4gZml0IG91ciBMU1RNIHVzaW5nIGEgZm9yIGxvb3AgKHdlIGRvIHRoaXMgdG8gbWFudWFsbHkgcmVzZXQgc3RhdGVzKS4gCiogV2Ugc2V0IGBzaHVmZmxlID0gRkFMU0VgIHRvIHByZXNlcnZlIHNlcXVlbmNlcwoKYGBge3J9Cmhpc3RfbW9kZWwgPC0gbW9kZWwgJT4lIGZpdCh4ICAgICAgICAgID0geF90cmFpbl9hcnIsIAogICAgICAgICAgICAgICAgICAgICAgICAgICAgeSAgICAgICAgICA9IHlfdHJhaW5fYXJyLCAKICAgICAgICAgICAgICAgICAgICAgICAgICAgIGVwb2NocyAgICAgPSAxMCwKICAgICAgICAgICAgICAgICAgICAgICAgICAgIHZlcmJvc2UgICAgPSBUUlVFLCAKICAgICAgICAgICAgICAgICAgICAgICAgICAgIGJhdGNoX3NpemUgPSA2NCwKICAgICAgICAgICAgICAgICAgICAgICAgICAgIHZhbGlkYXRpb25fc3BsaXQgPSAwLjI1LCAKICAgICAgICAgICAgICAgICAgICAgICAgICAgIHNodWZmbGUgICAgPSBGQUxTRSkKYGBgCgpgYGB7cn0KaGlzdF9tb2RlbCAlPiUgcGxvdCgpCmBgYAoKCmBgYHtyfQptb2RlbCAlPiUgZXZhbHVhdGUoeF90ZXN0X2FyciwgeV90ZXN0X2FycikKYGBgCgojIyBQcmVkaWN0aW5nIFN0b2NrIGNoYW5nZXMKCiogV2UgZmlyc3QgcHJlZGljdCB0aGUgb3V0cHV0IG9mIG91ciB0ZXN0IGRhdGEKCmBgYHtyfQptb2RlbF9wcmVkIDwtIG1vZGVsICU+JSBwcmVkaWN0KHhfdGVzdF9hcnIpICU+JSBhcy5udW1lcmljKCkKYGBgCgoqIEhvd2V2ZXIsIHdlIG5lZWQgdG8gcmVzY2FsZSB0aGUgb3V0cHV0LiBGb3IgbWluLW1heCBzY2FsaW5nLCB0aGlzIGZ1bmN0aW9uIHdpbGwgZG8gdGhlIHRyaWNrCgpgYGB7cn0KcmV2ZXJzZV9ub3JtPC0gZnVuY3Rpb24oeCwgbWVhbiwgc2RzKSB7CiAgeF9yZSA8LSAoeCAqIHNkcykgKyBtZWFuCiAgcmV0dXJuKHhfcmUpCiAgfQpgYGAKCiogV2UgYXBwbHkgaXQgd2l0aCBvdXIgZGF0YSBhbmQgdGhlIHNhdmVkIG1pbiBhbmQgbWF4IHZhbHVlcyBmcm9tIHRoZSByZWNpcGUKCmBgYHtyfQpldmFsIDwtIHRpYmJsZSgKICBpbmRleCA9IGRhdGFfdGVzdCAlPiUgcHVsbChpbmRleCksCiAgdHJ1dGggPSBkYXRhX3Rlc3QgJT4lIHB1bGwodmFsdWUpLAogIHByZWQgPSBtb2RlbF9wcmVkICU+JSByZXZlcnNlX25vcm0oeCA9IC4sIG1lYW4gPSBwcmVwX2hpc3RvcnkkbWVhbiwgc2RzID0gcHJlcF9oaXN0b3J5JHNkcykKKSAKYGBgCgpgYGB7ciwgZmlnLndpZHRoPTcuNSwgZmlnLmhlaWdodD01fQpldmFsICU+JSAKICBwaXZvdF9sb25nZXIoLWluZGV4KSAlPiUKICBnZ3Bsb3QoYWVzKHggPSBpbmRleCwgeSA9IHZhbHVlLCBjb2wgPSBuYW1lKSkgKwogIGdlb21fbGluZSgpCmBgYApXZWxsLi4uIHNvc28KCgojIEJyaWVmIGludHJvIHRvIHdvcmtpbmcgd2l0aCB0aW1lIHNlcXVlbmNlcyBhbmQgdGltZSBzZXJpZXMgZ2VuZXJhdG9ycwoKIyMgRXhhbXBsZSB0aW1lc2VyaWVzOgoKKiBPaywgbGV0cyB0YWtlIGEgYnJpZWYgbG9vayBhdCBob3cgdG8gd29yayB3aXRoIHNlcXVlbnRpb24gZGF0YSBpIGRpZmZlcmVudCB3YXlzLCBhbmQgcHJlcGFyZSB0aGVtIGFzIGlucHV0cyBmb3IgYW4gTFNUTQoqIFdlLCBmb3IgdGhlIHNha2Ugb2YgaWxsdXN0cmF0aW9uLCBqdXN0IGNyZWF0ZSBhIHNpbXBsZSBzZXF1ZW5jZSB3aXRoIHRoZSBudW1iZXJzIGZyb20gMS0xMDAgKGl0cyBlYXNpZXIgdG8gaW5zcGVjdCB0aGUgc2VxdWVuY2UsIGluIHJlYWxpdHkgd2Ugd291bGQgb2J2aW91c2x5IGZlZWQgaXQgd2l0aCBkaWZmZXJlbnQgb3V0cHV0cykKCmBgYHtyfQojIEdlbmVyYXRlIGFuIGV4YW1wbGUgc2VxdWVuY2UKZGF0YV9leGFtcGxlIDwtIDE6MTAwICAjJT4lIGFycmF5X3Jlc2hhcGUoZGltID0gYyhsZW5ndGgoLiksIDEsIDEpKQpgYGAKCiMjIE1hbnktdG8tT25lIHByZWRpY3Rpb25zCgoqIEluIHRoaXMgc2V0dXAsIHdlIHdpbGwgdXNlIHNldmVyYWwgcGVyaW9kcyB0byBwcmVkaWN0IG9uZSBzdWJzZXF1ZW50IG9ic2VydmF0aW9ucy4KCmBgYHtyfQpuX3RpbWVzdGVwcyA8LSAxMCAgIyBEZWZpbmUgdGhhdCB3ZSB3b3VsZCBsaWtlIHRvIGhhdmUgNSB0aW1lc3RlcHMKYmF0Y2hfc2l6ZSA8LSA2ICMgQmF0Y2ggc2l6ZSAoc29tZXdoYXQgYXJiaXRyYXJ5KQpuX2ZlYXR1cmVzIDwtIDEgIyBOdW1iZXIgb2YgZmVhdHVyZXMuIFNpbmNlIHdlIG9ubHkgcHJlZGljdCB0aGUgb3V0Y29tZSBiYXNlZCBvbiBpdHMgb3duIHNlcXVlbmNlLCBpdCB3aWxsIGJlIDEKYGBgCgoqIFdlIHdpbGwgc2V0IHVwIEtlcmFzIGB0aW1lc2VyaWVzX2dlbmVyYXRvcmAsIHdoaWNoIHdpbGwgZmVlZCB0aGUgTFNUTSAob3Igb3RoZXIgYXJjaGl0ZWN0dXJlKSB3aXRoIG9uLXRoZS1mbHkgZ2VuZXJhdGVkIHNlcXVlbmNlcyAKCmBgYHtyfQp0cmFpbl9nZW4gPC0gCiAgdGltZXNlcmllc19nZW5lcmF0b3IoCiAgICBkYXRhID0gZGF0YV9leGFtcGxlLCAjIFRoZSBkYXRhIHdlIHdpbGwgdXNlIHRvIGNyZWF0ZSB0aGUgc2VxdWVuY2VzLgogICAgdGFyZ2V0cyA9IGRhdGFfZXhhbXBsZSwgIyBUaGUgcHV0Y29tZSBkYXRhLCBpbiB0aGlzIGNhc2UgdGhlIHNhbWUsIHNpbmNlIHdlIGp1c3Qgd2FudCB0byBwcmVkaWN0IHRoZSBzdWJzZXF1ZW50IHBlcmlvZAogICAgbGVuZ3RoID0gbl90aW1lc3RlcHMsICMgSG93IG1hbnkgcHJldmlvdXMgc3RlcHMgaW4gdGhlIHNlcXVlbmNlIHNob3VsZCBiZSB1c2VkIGZvciB0aGUgcHJlZGljdGlvbgogICAgc2FtcGxpbmdfcmF0ZSA9IDEsICMgU2hvdWxkIHdlIHVzZSBldmVyeSBvYnNlcnZhdGlvbiBpbiB0aGUgc2VxdWVuY2Ugb3Igc2tpcCBzb21lPwogICAgc3RyaWRlID0gMSwgIyBIb3cgbWFueSBzdGVwcyBzaG91bGQgYmUgc2tpcHBlZAogICAgc2h1ZmZsZSA9IEZBTFNFLCAjIFNob3VsZCB0aGUgc2VxdWVuY2UgYmUgc2h1ZmZsZWQ/IEluIHRpbWUtc2VyaWVzIHByZWRpY3Rpb24sIHdlIHdhbnQgdG8gcHJlc2VydmUgdGhlIG9yZGVyIG9mIHNlcXVlbmNlcywgc28gYWx3YXlzIEZBTFNFCiAgICBiYXRjaF9zaXplID0gYmF0Y2hfc2l6ZSAjIHNpemUgb2YgdGhlIGJhdGNoZXMgZ2VuZXJhdGVkLiBVU2UgdGhpcyBiYXRjaCBzaXplIGFsc28gbGF0ZXIgaW4gdGhlIExTVE0KICAgICkKCmBgYAoKKiBSZW1lbWJlciwgdGhpcyBpcyBhIGxhenkgZnVuY3Rpb24sIG1lYW5pbmcgaXQgd2lsbCBnZW5lcmF0ZSB0aGUgc2VxdWVuY2VzIG9uLXRoZS1mbHkgd2hlbiB0aGV5IGFyZSBuZWVkZWQuCiogVGhlcmVmb3JlLCBpdCBjYW4gbm90IGRpcmVjdGx5IGJlIGluc3BlY3RlZC4KCmBgYHtyfQp0cmFpbl9nZW4KYGBgCgoqIEhvd2V2ZXIsIHdlIGNhbiBleHRyYWN0IHNpbmdsZSBiYXRjaGVzIGFuZCBpbnNwZWN0IHRoZW0uCiogVGhpcyBpcyBoZWxwZnVsIHRvIGdldCBhIGZlZWxpbmcgd2hhdCB0aGUgZGlmZmVyZW50IGFyZ3VtZW50cyBvZiB0aGUgZ2VuZXJhdG9yIGRvLCBhbmQgdG8gdGhlc3QgdGhhdCB0aGV5IGNyZWF0ZSB0aGUgc2VxdWVuY2UgeW91IHdhbnQuCiogSGVyZSwgdHdvIGFycnJheXMgd2lsbCBiZSByZXR1cm5lZCwgd2hlcmUgdGhlIGZpcnN0IG9uZSBpcyB0aGUgZ2VuZXJhdGVkIGlucHV0IHNlcXVlbmNlcywgdGhlIHNlY29uZCBvbmUgdGhlIGNvcnJlc3BvbmRpbmcgb3V0cHV0LgoKYGBge3J9CmJhdGNoXzAgPC0gdHJhaW5fZ2VuWzBdCmJhdGNoXzAKYGBgCgpgYGB7cn0KIyBjcmVhdGUgdGhlIG1vZGVsCm1vZGVsIDwtIGtlcmFzX21vZGVsX3NlcXVlbnRpYWwoKSAgJT4lCiAgIyBBZGQgdGhlIGxheWVyLiBXZSB3aWxsIG1ha2UgaXQgYXMgc2ltcGxlIGFzIHBvc3NpYmxlIGhlcmUgd2l0aCBqdXN0IG9uZSBMU1RNIGFuZCBhbiBvdXRwdXQgbGF5ZXIuCiAgbGF5ZXJfbHN0bSgKICAgIHVuaXRzID0gMzIsIAogICAgYmF0Y2hfaW5wdXRfc2hhcGUgID0gYyhiYXRjaF9zaXplLCBuX3RpbWVzdGVwcywgbl9mZWF0dXJlcyksICMgdGhlIGZpcnN0IGxheWVyIGluIGEgbW9kZWwgbmVlZHMgdG8ga25vdyB0aGUgc2hhcGUgb2YgdGhlIGlucHV0IGRhdGEKICAgICNkcm9wb3V0ID0gMC4xLAogICAgI3JlY3VycmVudF9kcm9wb3V0ID0gMC4xLAogICAgcmV0dXJuX3NlcXVlbmNlcyA9IEZBTFNFLCAjIGJ5IGRlZmF1bHQsIGFuIExTVE0ganVzdCByZXR1cm5zIHRoZSBmaW5hbCBzdGF0ZQogICAgc3RhdGVmdWwgPSBUUlVFKSAlPiUgCiAgIyBGaW5hbCBvdXRwdXQgbGF5ZXIKICBsYXllcl9kZW5zZSh1bml0cyA9IDEpCgptb2RlbCAlPiUgY29tcGlsZShsb3NzID0gJ21zZScsIG9wdGltaXplciA9IG9wdGltaXplcl9hZGFtKCksIG1ldHJpY3MgPSAnbXNlJykKYGBgCgoKCgpgYGB7cn0Kbl9zdGVwcyA8LSByb3VuZCgobGVuZ3RoKGRhdGFfZXhhbXBsZSkgLSBuX3RpbWVzdGVwcykgLyBiYXRjaF9zaXplLCAxKSAKCmhpc3QgPC0gbW9kZWwgJT4lIGZpdF9nZW5lcmF0b3IoCiAgZ2VuZXJhdG9yID0gdHJhaW5fZ2VuLAogIHN0ZXBzX3Blcl9lcG9jaCA9IG5fc3RlcHMsCiAgZXBvY2hzID0gMTAKICApCmBgYAoKIyMgWW91ciB0dXJuCgoqIFBsYXkgYSBiaXQgYXJvdW5kIHdpdGggdGhlIGFyZ3VtZW50cyBpbiB0aGUgZ2VuZXJhdG9yLCBhbmQgc2Ugd2hhdCBvdXRwdXRzIGl0IHByb2R1Y2VzLiBUaGlzIHdpbGwgZ2l2ZSB5b3Ugc29tZSBpbnR1aXRpb24KKiBGb3IgaW5zdGFuY2UsIHdoYXQgaGFwcGVucyBpZiB5b3Ugc2V0IGBzdHJpZGVgIHRvIGB0aW1lX3AgKyAxYCA/CgoKIyMgTWFueSB0byBtYW55IHByZWRpY3Rpb25zCgoqIEluIGNhc2Ugd2Ugd2FudCB0byBwcmVkaWN0IGEgc2VxdWVuY2Ugb2Ygc2V2ZXJhbCB0aW1lc3RlcHMuCiogVW5mb3J0dW5hdGVseSwgdGhlIGdlbmVyYXRvciBoYXMgbm8gb3B0aW9uIGZvciB0aGF0LCBzbyB3ZSBoYXZlIHRvIHByZXBhcmUgc2VwcGVyYXRlIHRhcmdldHMgb24gb3VyIG93bi4KKiBJaCB3cm90ZSBhIGhhbmR5IGZ1biBjdGlvbiB0aGF0IGRvZXMgc28sIHdoaWNoIHlvdSBjYW4gdXNlLgoKCmBgYHtyfQojIERlZmluZSBhIGZ1bmN0aW9uIHRoYXQgb3V0cHV0cyB0aW1lX3AgdGltZXN0ZXBzIGZvciB5Cmdlbl90aW1lc2VyaWVzX291dHB1dCA8LSBmdW5jdGlvbihkYXRhLCBuX3RpbWVzdGVwc19wdXQpewogIAogIHRhcmdldCA8LSBtYXRyaXgobnJvdyA9IGxlbmd0aChkYXRhKSwgbmNvbCA9bl90aW1lc3RlcHNfb3V0KQogIAogIGRhdGEgPC0gZGF0YSAlPiUgYXMubnVtZXJpYygpCiAgCiAgZm9yIChpIGluIDE6bGVuZ3RoKGRhdGEpKSB7CiAgICB0YXJnZXRbaSxdIDwtIGRhdGFbKGkrMSk6KGkrbl90aW1lc3RlcHNfb3V0KV0KICB9CiAgCiAgcmV0dXJuKHRhcmdldCkKfQpgYGAKCiogTGV0J3MgdHJ5IGl0CgpgYGB7cn0Kbl90aW1lc3RlcHNfb3V0IDwtIDUKCm91dGNvbWVfc2VxdW5jZSA8LSBkYXRhX2V4YW1wbGUgJT4lCiAgZ2VuX3RpbWVzZXJpZXNfb3V0cHV0KG5fdGltZXN0ZXBzX291dCkKYGBgCgoqIExldHMgaW5zcGVjdAoKYGBge3J9Cm91dGNvbWVfc2VxdW5jZSAlPiUgaGVhZCgyMCkKYGBgCgoqIFNlZW1zIHRvIHByb2R1Y2Ugd2hhdCB3ZSB3YW50CiogTm93IHdlIGNhbiBmZWVkIHRoYXQgYXMgdGFyZ2V0IGludG8gdGhlIGdlbmVyYXRvcgoKYGBge3J9CnRyYWluX2dlbl9zZXEgPC0gCiAgdGltZXNlcmllc19nZW5lcmF0b3IoCiAgICBkYXRhID0gZGF0YSwKICAgIHRhcmdldHMgPSBvdXRjb21lX3NlcXVuY2UsCiAgICBsZW5ndGggPSA1LAogIHNhbXBsaW5nX3JhdGUgPSAxLAogIHN0cmlkZSA9IDEsCiAgc2h1ZmZsZSA9IEZBTFNFLAogIGJhdGNoX3NpemUgPSAxNgopCgpgYGAKCiogTGV0cyBpbnN0ZWN0CgpgYGB7cn0KYmF0Y2hfMF9zZXEgPSB0cmFpbl9nZW5fc2VxWzBdCmJhdGNoXzBfc2VxCmBgYAoKKiBMb29rcyBhYm91dCByaWdodCwgZG9zbnQgaXQ/CgojIE11bHRpcGxlIHRpbWVzdGVwcyBzdG9jIHByZWRpY3Rpb24KCiMjIE1hbnktdG8tb25lCgpgYGB7cn0Kbl94IDwtIDEgIyBudW1iZXIgb2YgZmVhdHVyZXMKdGltZV94IDwtIDQgIyA0IGRheXMKdGltZV95IDwtIDEgIyAuLi4gdG8gcHJlZGljdCBvbmUgZGF5IGFoZWFkCmBgYAoKCmBgYHtyfQojIFRSYW5zZm9ybWluZyB0aGUgeCBzZXF1ZW5jZSB0byBhIDNkIHRlbnNvciAobmVjZXNzYXJ5IGZvciBMU1RNcykKeF90cmFpbl9hcnJfbjEgPC0gZGF0YV9yZWNpcGUgJT4lIGp1aWNlKCkgICU+JSBwdWxsKHZhbHVlKSAlPiUgYXMubWF0cml4KG5jb2wgPSB0aW1lX3gpICU+JSBhcnJheV9yZXNoYXBlKGRpbSA9IGMobnJvdyguKSwgbmNvbCguKSwgMSkpCgp4X3Rlc3RfYXJyX24xIDwtIHhfdGVzdCAlPiUgcHVsbCh2YWx1ZSkgJT4lIGFzLm51bWVyaWMoKSAlPiUgYXJyYXlfcmVzaGFwZShkaW0gPSBjKGxlbmd0aCguKSwgMSwgMSkpCgp5X3RyYWluX2FycjIgPC0geV90cmFpbiAlPiUgcHVsbCh2YWx1ZSkgJT4lIGFzLm51bWVyaWMoKSAlPiUgYXJyYXlfcmVzaGFwZShkaW0gPSBjKGxlbmd0aCguKSwgMSkpCnlfdGVzdF9hcnIyIDwtIHlfdGVzdCAlPiUgcHVsbCh2YWx1ZSkgJT4lIGFzLm51bWVyaWMoKSAlPiUgYXJyYXlfcmVzaGFwZShkaW0gPSBjKGxlbmd0aCguKSwgMSkpCmBgYAoKYGBge3J9CnggPC0gZGF0YV9yZWNpcGUgJT4lIGp1aWNlKCkgICU+JSBwdWxsKHZhbHVlKSAlPiUgbWF0cml4KG5jb2wgPSB0aW1lX3gpCmRpbSh4KVsyXQpsZW5ndGgoeClbMl0KYGBgCgoKYGBge3J9CnhfdHJhaW5fYXJyICU+JSBkaW0oKQpgYGAKCmBgYHtyfQp4X3RyYWluX2FyciAlPiUgZ2xpbXBzZSgpCmBgYAoKCgo8IS0tLS0KIyBNdWx0aS1lcGlzb2RlIExTVE0KCiMjIFRyYW5zZm9ybSB0byBhIDNkIHRlbnNvciBmb3Iga2VyYXMKCmBgYHtyfQp0c3RlcHNfeCA9IDUKdHN0ZXBzX3kgPSA1CmBgYAoKCmBgYHtyfQp0cmFpbl9hcnIgPC0geF90cmFpbiAlPiUgcHVsbCh2YWx1ZSkgJT4lIGFzLm51bWVyaWMoKSAlPiUgbWF0cml4KG5jb2wgPSAodHN0ZXBzX3ggKyB0c3RlcHNfeSkpCmBgYAoKYGBge3J9CnhfdHJhaW5fYXJyIDwtIHRyYWluX2FyclssMTp0c3RlcHNfeF0gJT4lIGFycmF5X3Jlc2hhcGUoZGltID0gYyhsZW5ndGgoLiksIDEsIDEpKQpgYGAKCgpgYGB7cn0KI3hfdHJhaW4gJTw+JSBwdWxsKHZhbHVlKSAlPiUgYXMubnVtZXJpYygpICU+JSBhcnJheV9yZXNoYXBlKGRpbSA9IGMobGVuZ3RoKC4pLCAxLCAxKSkKI3hfdGVzdCAlPD4lIHB1bGwodmFsdWUpICU+JSBhcy5udW1lcmljKCkgJT4lIGFycmF5X3Jlc2hhcGUoZGltID0gYyhsZW5ndGgoLiksIDEsIDEpKQoKI3lfdHJhaW4gJTw+JSBwdWxsKHZhbHVlKSAlPiUgYXMubnVtZXJpYygpICU+JSBhcnJheV9yZXNoYXBlKGRpbSA9IGMobGVuZ3RoKC4pLCAxKSkKI3lfdGVzdCAlPD4lIHB1bGwodmFsdWUpICU+JSBhcy5udW1lcmljKCkgJT4lIGFycmF5X3Jlc2hhcGUoZGltID0gYyhsZW5ndGgoLiksIDEpKQpgYGAK

Sequence-2-Sequence forecasting (R)

Daniel S. Hain (dsh@business.aau.dk)

Updated November 17, 2021