New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

Classification ppg #79

Merged

Erikpostt merged 4 commits into main from classification_ppg

Dec 3, 2024

Contributor

KarsVeldkamp commented Dec 3, 2024

Hierbij de pull request voor de classification stap. Ik verwerk de comments vanuit feature extraction (kleine dingen) in de volgende PR van quantification (heart rate) omdat ik al in die branch actief aan het werk ben.

KarsVeldkamp added 4 commits

November 29, 2024 14:38


          Adding signal quality classification code

82e84a7


          Merge branch 'main' of https://github.com/biomarkersParkinson/paradigma…

b7e1336

… into classification_ppg


          adding classifier

746d636


          Merge branch 'main' of https://github.com/biomarkersParkinson/paradigma…

6f0632a

… into classification_ppg

KarsVeldkamp requested a review from Erikpostt

December 3, 2024 07:46

KarsVeldkamp assigned Erikpostt

Erikpostt reviewed

View reviewed changes

src/paradigma/heart_rate/heart_rate_analysis.py

                   # Compute statistics of the spectral domain signals
                   df_windowed = extract_spectral_domain_features(config, df_windowed)
+                  df_windowed.drop(columns = ['green'], inplace=True)  # Drop the values channel since it is no longer needed

Contributor

Erikpostt Dec 3, 2024 •

edited

Loading

Ik snap wat je bedoeling is hier, en het scheelt ook code. Maar inplace=True wordt over het algemeen afgeraden:

Contributor Author

KarsVeldkamp Dec 3, 2024

Is het een kwestie van de parameter weghalen? En ben het eens met je laatste comment dat dit miss uberhaupt overbodig is gezien we wss de return aan willen passen!

Contributor

Erikpostt Dec 3, 2024

Je moet de transformatie nog wel assignen aan een object, bijv: df_windowed = df_windowed.drop(columns=['green'])

Erikpostt reviewed

View reviewed changes

src/paradigma/heart_rate/heart_rate_analysis.py

+                  sigma = clf['sigma']
+                  # Prepare the data
+                  lr_clf.feature_names_in_ = ['var', 'mean', 'median', 'kurtosis', 'skewness', 'f_dom', 'rel_power', 'spectral_entropy', 'signal_to_noise', 'auto_corr']

Contributor

Erikpostt Dec 3, 2024

Je zou nog kunnen kijken of je deze feature names bij het wegschrijven van de classifier naar pickle mee kan geven. Dan definieer je ze niet twee keer, en kan het ook niet mis gaan als je er één aanpast.

Erikpostt reviewed

View reviewed changes

src/paradigma/heart_rate/heart_rate_analysis.py

Comment on lines +71 to +73

+                  X_normalized = X.copy()
+                  for idx, feature in enumerate(lr_clf.feature_names_in_):
+                      X_normalized[feature] = (X[feature] - mu[idx]) / sigma[idx]

Contributor

Erikpostt Dec 3, 2024

Je zou eens kunnen kijken naar: https://scikit-learn.org/dev/modules/generated/sklearn.preprocessing.StandardScaler.html

Erikpostt reviewed

View reviewed changes

src/paradigma/heart_rate/heart_rate_analysis.py

+                  # Make predictions for PPG signal quality assessment
+                  df[DataColumns.PRED_SQA_PROBA] = lr_clf.predict_proba(X_normalized)[:, 0]
+                  df.drop(columns = lr_clf.feature_names_in_, inplace=True)  # Drop the features used for classification since they are no longer needed

Contributor

Erikpostt Dec 3, 2024

Hier geldt hetzelfde als mijn eerdere comment over inplace=True.

Erikpostt reviewed

View reviewed changes

src/paradigma/heart_rate/heart_rate_analysis.py

+                  df[DataColumns.PRED_SQA_PROBA] = lr_clf.predict_proba(X_normalized)[:, 0]
+                  df.drop(columns = lr_clf.feature_names_in_, inplace=True)  # Drop the features used for classification since they are no longer needed
+                  return df

Contributor

Erikpostt Dec 3, 2024

Ik denk zelfs uiteindelijk dat we helemaal geen dataframe hoeven te returnen, maar alleen een numpy.array of pandas.Series van de predicted probability. In principe is deze dataframe hetzelfde als de input, met één extra kolom, nietwaar? Ik heb dit zelf ook nog niet geïmplementeerd, dus food for thought.

Contributor Author

KarsVeldkamp Dec 3, 2024

@Erikpostt Ik denk het ook maar daar moeten we de komende tijd maar even kritisch over nadenken wat het meest handige is.

Erikpostt approved these changes

View reviewed changes

Contributor

Erikpostt left a comment

Ziet er goed uit! Merging...

Erikpostt merged commit cfc2fcb into main

1 check passed

KarsVeldkamp deleted the classification_ppg branch

December 3, 2024 11:05

Erikpostt assigned KarsVeldkamp and unassigned Erikpostt

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet