webentwicklung-frage-antwort-db.com.de

Wie bekomme ich eine Liste der eingebauten Datensätze in R?

Kann jemand bitte helfen, eine Liste der eingebauten Datensätze und ihrer Abhängigkeitspakete zu erhalten?

23
mockash

Es gibt verschiedene Möglichkeiten, die enthaltenen Datensätze in R zu finden:

1: Mit data() erhalten Sie eine Liste der Datensätze aller geladenen Pakete (und nicht nur der aus dem datasets-Paket). Die Datensätze werden nach Paket geordnet

2: Mit data(package = .packages(all.available = TRUE)) erhalten Sie eine Liste aller Datensätze in den verfügbaren Paketen auf Ihrem Computer (d. H. Auch die nicht geladenen).

3: Wenn Sie data(package = "packagename") verwenden, erhalten Sie die Datensätze dieses bestimmten Pakets. data(package = "plyr") gibt die Datensätze im Paket plyr an


Wenn Sie wissen möchten, in welchem ​​Paket sich ein Dataset befindet (z. B. das Dataset acme), können Sie Folgendes tun:

dat <- as.data.frame(data(package = .packages(all.available = TRUE))$results)
dat[dat$Item=="acme", c(1,3,4)]

was gibt:

    Package Item                  Title
107    boot acme Monthly Excess Returns
32
Jaap

Oft muss ich auch wissen, welche Struktur von Datensätzen verfügbar ist. Deshalb habe ich dataStr in meinem misc-Paket erstellt.

dataStr <- function(package="datasets", ...)
  {
  d <- data(package=package, envir=new.env(), ...)$results[,"Item"]
  d <- sapply(strsplit(d, split=" ", fixed=TRUE), "[", 1)
  d <- d[order(tolower(d))]
  for(x in d){ message(x, ":  ", class(get(x))); message(str(get(x)))}
  }
dataStr()

Bitte beachten Sie, dass die Ausgabe in der Konsole ziemlich lang ist.

Dies ist die Art der Ausgabe:

[...]

warpbreaks:  data.frame
'data.frame':   54 obs. of  3 variables:
 $ breaks : num  26 30 54 25 70 52 51 26 67 18 ...
 $ wool   : Factor w/ 2 levels "A","B": 1 1 1 1 1 1 1 1 1 1 ...
 $ tension: Factor w/ 3 levels "L","M","H": 1 1 1 1 1 1 1 1 1 2 ...

WorldPhones:  matrix
 num [1:7, 1:7] 45939 60423 64721 68484 71799 ...
 - attr(*, "dimnames")=List of 2
  ..$ : chr [1:7] "1951" "1956" "1957" "1958" ...
  ..$ : chr [1:7] "N.Amer" "Europe" "Asia" "S.Amer" ...

WWWusage:  ts
 Time-Series [1:100] from 1 to 100: 88 84 85 85 84 85 83 85 88 89 ...

Edit: Um eine informativere Ausgabe zu erhalten und sie für entladene Pakete oder alle Pakete im Suchpfad zu verwenden, verwenden Sie bitte die überarbeitete Online-Version mit

source("https://raw.githubusercontent.com/brry/berryFunctions/master/R/dataStr.R")
2

Hier ist eine umfassende Liste mit Datensätzen für R-Pakete, die von Prof. Vincent Arel-Bundock gepflegt wird . https://vincentarelbundock.github.io/Rdatasets/

Rdatasets ist eine Sammlung von über 1200 Datensätzen, die ursprünglich .__ waren. zusammen mit der statistischen Softwareumgebung R und einigen seiner Zusatzpakete. Ziel ist es, diese Daten breiter zu machen zugänglich für Unterricht und statistische Softwareentwicklung.

1
Ayşe Nur

Lauf

help(package = "datasets")

in der R Studio-Konsole erhalten Sie alle verfügbaren Datensätze in der Registerkarte "Hilfe" auf der rechten Seite.

0
Igor Micev