RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 882528
Accepted
mr.T
mr.T
Asked:2020-09-18 13:52:17 +0000 UTC2020-09-18 13:52:17 +0000 UTC 2020-09-18 13:52:17 +0000 UTC

Read.table 无法正确读取数据

  • 772

有一个txt格式的数据集

<TICKER>,<PER>,<DATE>,<TIME>,<OPEN>,<HIGH>,<LOW>,<CLOSE>,<VOL>,<OI>
EURUSD,5,20180307,080500,1.24210,1.24219,1.24201,1.24214,117,0
EURUSD,5,20180307,081000,1.24217,1.24249,1.24212,1.24236,165,0
EURUSD,5,20180307,081500,1.24235,1.24279,1.24232,1.24259,251,0
EURUSD,5,20180307,082000,1.24260,1.24273,1.24238,1.24248,196,0
EURUSD,5,20180307,082500,1.24247,1.24262,1.24241,1.24259,173,0
EURUSD,5,20180307,083000,1.24257,1.24310,1.24242,1.24302,281,0
EURUSD,5,20180307,083500,1.24298,1.24327,1.24291,1.24310,204,0
итд

在“时间”行中,HHMMSS 格式应该有6位数字,但是当我尝试在“R”中读取文件时,时间读取不正确,文件的“上限”也是

d <- read.table(file = "C:/Users/TARAS/Desktop/OHLC.txt",header = T,sep = ",")
head(d)

 X.TICKER. X.PER.  X.DATE. X.TIME. X.OPEN. X.HIGH.  X.LOW. X.CLOSE. X.VOL. X.OI.
1    EURUSD      5 20180307   80500 1.24210 1.24219 1.24201  1.24214    117     0
2    EURUSD      5 20180307   81000 1.24217 1.24249 1.24212  1.24236    165     0
3    EURUSD      5 20180307   81500 1.24235 1.24279 1.24232  1.24259    251     0
4    EURUSD      5 20180307   82000 1.24260 1.24273 1.24238  1.24248    196     0
5    EURUSD      5 20180307   82500 1.24247 1.24262 1.24241  1.24259    173     0
6    EURUSD      5 20180307   83000 1.24257 1.24310 1.24242  1.24302    281 

如您所见,格式已更改为“HMMSS”

有时它会像这样发生

188    EURUSD      5 20180307  234000 1.24125 1.24137 1.24125  1.24134     45     0
189    EURUSD      5 20180307  234500 1.24130 1.24130 1.24111  1.24116     81     0
190    EURUSD      5 20180307  235000 1.24102 1.24115 1.24095  1.24096     89     0
191    EURUSD      5 20180307  235500 1.24097 1.24105 1.24092  1.24092     42     0
192    EURUSD      5 20180308       0 1.24091 1.24115 1.24091  1.24104     55     0
193    EURUSD      5 20180308     500 1.24103 1.24109 1.24102  1.24107     45     0
194    EURUSD      5 20180308    1000 1.24106 1.24107 1.24103  1.24105     37     0
195    EURUSD      5 20180308    1500 1.24106 1.24109 1.24100  1.24100     20     0
196    EURUSD      5 20180308    2000 1.24099 1.24102 1.24097  1.24098     21     0
197    EURUSD      5 20180308    2500 1.24099 1.24101 1.24096  1.24097     36     0
198    EURUSD      5 20180308    3000 1.24096 1.24110 1.24087  1.24109     81     0
199    EURUSD      5 20180308    3500 1.24108 1.24110 1.24106  1.24107     31         

如何解决?让我提醒您,.txt 文件中的所有内容都是正确的

r
  • 1 1 个回答
  • 10 Views

1 个回答

  • Voted
  1. Best Answer
    Alexshev92
    2020-09-18T19:08:43Z2020-09-18T19:08:43Z

    您可以为函数read.table指定参数colClasses,即 每列中显示的数据类型:

    d <- read.table(file = "C:/Users/TARAS/Desktop/OHLC.txt",header = T,sep = ",", 
                    colClasses=c("character", "numeric", "numeric", "character"))
    

    这里我们为前 4 列指定了数据类型,分别是字符串、数字、数字、字符串。现在 TIME 列中的数据将被视为字符串,不会丢弃第一个零:

      X.TICKER. X.PER.  X.DATE. X.TIME. X.OPEN. X.HIGH.  X.LOW. X.CLOSE. X.VOL. X.OI.
    1    EURUSD      5 20180307  080500 1.24210 1.24219 1.24201  1.24214    117     0
    2    EURUSD      5 20180307  081000 1.24217 1.24249 1.24212  1.24236    165     0
    3    EURUSD      5 20180307  081500 1.24235 1.24279 1.24232  1.24259    251     0
    4    EURUSD      5 20180307  082000 1.24260 1.24273 1.24238  1.24248    196     0
    5    EURUSD      5 20180307  082500 1.24247 1.24262 1.24241  1.24259    173     0
    6    EURUSD      5 20180307  083000 1.24257 1.24310 1.24242  1.24302    281     0
    7    EURUSD      5 20180307  083500 1.24298 1.24327 1.24291  1.24310    204     0
    

    此外,您应该像使用线条一样使用这些数据。

    • 1

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    是否可以在 C++ 中继承类 <---> 结构?

    • 2 个回答
  • Marko Smith

    这种神经网络架构适合文本分类吗?

    • 1 个回答
  • Marko Smith

    为什么分配的工作方式不同?

    • 3 个回答
  • Marko Smith

    控制台中的光标坐标

    • 1 个回答
  • Marko Smith

    如何在 C++ 中删除类的实例?

    • 4 个回答
  • Marko Smith

    点是否属于线段的问题

    • 2 个回答
  • Marko Smith

    json结构错误

    • 1 个回答
  • Marko Smith

    ServiceWorker 中的“获取”事件

    • 1 个回答
  • Marko Smith

    c ++控制台应用程序exe文件[重复]

    • 1 个回答
  • Marko Smith

    按多列从sql表中选择

    • 1 个回答
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Suvitruf - Andrei Apanasik 什么是空? 2020-08-21 01:48:09 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5