transbigdata 笔记: 官方文档示例3:车辆轨迹数据处理

1 读取数据+ 轨迹数据质量分析

这一部分和

transbigdata笔记:data_summary 轨迹数据质量/采样间隔分析-CSDN博客 的举例是一样的

import pandas as pd
import geopandas as gpd
import transbigdata as tbd


data = pd.read_csv('Downloads/TaxiData-Sample.csv', 
                   names=['VehicleNum', 'Time', 'Lng', 'Lat', 'OpenStatus', 'Speed'])
data

data['Time'] = pd.to_datetime(data['Time'])
data

tbd.data_summary(data,
                 col=['VehicleNum','Time'],
                show_sample_duration=True)

2 清除冗余点

这一个函数的详细用法可见:transbigdata笔记:数据预处理-CSDN博客

data=tbd.traj_clean_redundant(data,col=['VehicleNum','Time','Lng','Lat'])
data

3 清理不在研究区域的记录

transbigdata 笔记:官方文档案例1(出租车GPS数据处理)-CSDN博客 和这边的是一样的

sz = gpd.read_file('Downloads/sz.json')
sz.plot();

data=tbd.clean_outofshape(data,sz,col=['Lng','Lat'],accuracy=500)
data

4 清理研究区域内的轨迹漂移

transbigdata笔记:清理研究区域内的轨迹漂移-CSDN博客

data=tbd.traj_clean_drift(data,
                         col=['VehicleNum','Time','Lng','Lat'])
data

5 轨迹停止点和行程提取

transbigdata笔记:轨迹停止点和行程提取-CSDN博客

stay,move=tbd.traj_stay_move(data,
                            params,
                            col=['VehicleNum','Time','Lng','Lat'])
stay

停留状态开始时间、对应栅格编号、停留状态结束时间、轨迹所在位置、持续时间


move

 开始栅格、开始位置、结束位置、结束栅格

6 轨迹切片

transbigdata笔记:轨迹切片-CSDN博客

stay_points=tbd.traj_slice(data,
                          stay,
                          traj_col=['VehicleNum','Time'],
                          slice_col=['VehicleNum','stime', 'etime', 'stayid'])
stay_points

move_points=tbd.traj_slice(data,
                          move,
                          traj_col=['VehicleNum','Time'],
                          slice_col=['VehicleNum','stime', 'etime', 'moveid'])
move_points

7 轨迹密集化 

transbigdata 笔记: 轨迹密集化/稀疏化 & 轨迹平滑-CSDN博客

move_points_d2=tbd.traj_densify(move_points,
                              col=['moveid','Time','Lng','Lat'],
                              timegap=29)

每timegap秒有一个记录,用pandas的interpolate(method为index)实现

原来采样频率不是timegap的倍数,怎么办呢

move_points_d[move_points_d['moveid']==0.0].head(30)

通过结果(包括源码)可以发现,从move_points的最早的时刻开始,每timegap时刻就会有一条记录,和原先的记录一并存在【换句话说,至多每隔timegap秒都有一个轨迹点】

8 轨迹 稀疏化

transbigdata 笔记: 轨迹密集化/稀疏化 & 轨迹平滑-CSDN博客

move_points_s=tbd.traj_sparsify(move_points,
                               col=['moveid','Time','Lng','Lat'],
                               timegap=30,
                               method='subsample')

如果method是subsample,那么选取[t,t+subsample)这个时间段内第一次出现的记录,丢弃其他记录,如果某一个[t,t+subsample)时间段内没有数据,不用补值

如果method是interpolate的,那么就是从最开始的位置开始,每subsample秒 用pandas的interpolate方法插一个值,舍弃所有不在整subsample秒的原始记录

9 轨迹平滑

transbigdata 笔记: 轨迹密集化/稀疏化 & 轨迹平滑-CSDN博客

move_points_smooth=tbd.traj_smooth(move_points,
                                col=['VehicleNum','Time','Lng','Lat'],
                                process_noise_std=0.1,
                                measurement_noise_std=0.1)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/328720.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

微服务实战项目_天机学堂01_初识项目

文章目录 一.项目简述二.Jenkins三.模拟真实业务:紧急bug修复和代码阅读四.测试和部署五.代码阅读-获取登录用户 一.项目简述 Q:天机学堂是什么? A:天机学堂是一个基于微服务架构的生产级在线教育项目 主要有两个端(项目已上线,可以点击查看): 管理后台: https://tjxt-admi…

项目配置集成unocss指南

项目配置集成 unocss 指南 什么是 UnoCSS? Unocss 是一个基于 Tailwind CSS的工具 ,它通过静态分析 HTML 和 CSS 代码,自动消除未使用的样式,以减小生成的 CSS 文件大小。这个工具可以帮助开发者在使用 Tailwind CSS 进行开发时…

【linux】visudo

碎碎念 visudo命令是用来修改一个叫做 /etc/sudoers 的文件的,用来设置哪些 用户 和 组 可以使用sudo命令。并且使用visudo而不是使用 vi /etc/sudoers 的原因在于:visudo自带了检查功能,可以判断是否存在语法问题,所以更加安全 …

大神们都在用的5款AI写作软件

在当今信息爆炸的时代,写作已经成为了人们生活和工作中不可或缺的一部分。然而,对于许多人来说,写作并不是一件轻松的事情。幸运的是,随着人工智能技术的不断发展,AI写作软件应运而生。这些软件利用先进的自然语言处理…

HTML5:dialog

JavaScript 练手小技巧&#xff1a;HTML5 的 dialog 标签制作对话框_dialog html-CSDN博客 <dialog id"dialog"> <h2 align"center">修改</h2> <input type"text" id"title1" placeholder"标题" value…

【论文阅读笔记】4篇Disentangled representation learning用于图像分割的论文

4篇应用解耦表示学习的文章&#xff0c;这里只关注如何解耦&#xff0c;更多细节不关注&#xff0c;简单记录一下。 1.Robust Multimodal Brain Tumor Segmentation via Feature Disentanglement and Gated Fusion Chen C, Dou Q, Jin Y, et al. Robust multimodal brain tum…

写点东西《最佳 Web 框架不存在 》

写点东西《&#x1f947;最佳 Web 框架不存在 &#x1f6ab;》 TLDR&#xff1b;您选择的 Web 应用程序框架并不重要。嗯&#xff0c;它很重要&#xff0c;但并不像其他人希望您相信的那样重要。 2024 年存在如此多的库和框架&#xff0c;而且最好的库和框架仍然备受争议&…

瑞_Java开发手册_(四)安全规约

&#x1f64a;前言&#xff1a;本文章为瑞_系列专栏之《Java开发手册》的安全规约篇。由于博主是从阿里的《Java开发手册》学习到Java的编程规约&#xff0c;所以本系列专栏主要以这本书进行讲解和拓展&#xff0c;有需要的小伙伴可以点击链接下载。本文仅供大家交流、学习及研…

Kafka 的架构

实验过程 1.三个虚拟机中解压kafka软件包 tar -zxvf kafka_2.11-1.1.1.tgz 2.修改 3 个节点配置文件 在 zookeeper 节点&#xff0c;进入 kafka_2.11-1.1.1/config 目录下&#xff0c;编辑 server.properties 文件 [rootdb1 ~]# cd kafka_2.11-1.1.1/config [rootdb1 con…

使用斐波那契(Fibonacci)数列来测试各大语言的性能

笔者使用最多的语言是C&#xff0c;目前项目中在使用Go&#xff0c;也使用过不少其它语言&#xff0c;像Erlang&#xff0c;Python&#xff0c;Lua&#xff0c;C#等等。最近看到C#夺冠&#xff0c;首次荣获 TIOBE 年度编程语言&#xff0c;同时也看到网上有不少Java与C#之争的文…

Ubuntu 22.04安装使用easyconnect

EasyConnect 百度百科&#xff0c;EasyConnect能够帮助您在办公室之外使用公司内网的所有系统及应用。在您的公司部署深信服远程应用发布解决方案后&#xff0c;您的公司所有业务系统及应用都可以轻松迁移至移动互联网上。您可以通过手机、PAD等智能移动终端随时随地开展您的业…

现代工程科技杂志现代工程科技杂志社现代工程科技编辑部2023年第21期目录

能源科技 配网故障停电原因及改进对策研究 上官安琪 110kV变电站电气自动化技术及应用策略 陈祥 变电运维误操作事故预控措施分析 高翔;韦婉 智能变电站变电运维安全与设备维护探究 温亮亮;覃万全 110kV变电站电气设计及其防雷保护案例研析 谢旭平 变电运维…

Kafka系列(四)

本文接kafka三&#xff0c;代码实践kafkaStream的应用&#xff0c;用来完成流式计算。 kafkastream 关于流式计算也就是实时处理&#xff0c;无时间概念边界的处理一些数据。想要更有性价比地和java程序进行结合&#xff0c;因此了解了kafka。但是本人阅读了kafka地官网&#…

探索 Python:发现有趣的库——第 1 章:数据可视化之旅

在一个充满活力的科技世界中&#xff0c;数据分析专家“算法仙”和编程爱好者“代码侠”相遇了&#xff0c;决定一起踏上数据可视化的探险之旅。他们将运用 Matplotlib 和 Seaborn 这两个强大的 Python 库&#xff0c;将枯燥的数据转化为生动的图形。 算法仙&#xff1a;你好&…

利用先进的条形码识别和 OCR 技术改善机场行李处理

机场每年处理数百万件行李&#xff0c;主要航空公司每家运输超过 1 亿件行李。每年有 2500 万件行李被错误处理&#xff0c;正确处理至关重要。使用最好的技术是关键&#xff0c;首先是从机场到飞机的正确转乘。 行李分拣 Dynamsoft 的客户是一家机场行李分拣解决方案提供商。…

【Linux 内核源码分析】RCU机制

RCU 基本概念 Linux内核的RCU&#xff08;Read-Copy-Update&#xff09;机制是一种用于实现高效读取和并发更新数据结构的同步机制。它在保证读操作不被阻塞的同时&#xff0c;也能够保证数据的一致性。 RCU的核心思想是通过延迟资源释放来实现无锁读取&#xff0c;并且避免了…

Go新项目-配置文件的选取及区别和写法(1)

先说结论&#xff1a;我们选型TOML yaml&#xff0c;toml&#xff0c;json&#xff0c;ini 实际业务都有用 实际栗子是&#xff1a;我们想要把Go的切片作为配置文件&#xff0c;YAML写起来比较吃力&#xff0c;TOML就很容易了。 配置文件是用于配置计算机程序的参数、初始化设…

FPGA设计时序约束十六、虚拟时钟Virtual Clock

目录 一、序言 二、Virtual Clock 2.1 设置界面 三、工程示例 3.1 工程设计 3.2 工程代码 3.3 时序报告 3.4 答疑 四、参考资料 一、序言 在时序约束中&#xff0c;存在一个特殊的时序约束&#xff0c;虚拟时钟Virtual Clock约束&#xff0c;根据名称可看出时钟不是实…

自动化测试——Python基础

文章目录 前言一、Python的基础语法1.标识符2.注释 二、Python中常见的数据类型1.Number&#xff08;数字&#xff09;1.1.int&#xff08;整数数据类型&#xff09;1.2.float&#xff08;浮点型&#xff09;1.3.bool&#xff08;布尔类型&#xff09; 2.String&#xff08;字符…

Redis 消息队列和发布订阅

文章目录 基本模式生产者消费者原理&模型redis实现java实现 发布者订阅者原理&模型redis实现java实现 stream模式原理&模型工作原理redis实现Java实现 选型外传 基本模式 采用redis 三种方案&#xff1a; ● 生产者消费者&#xff1a;一个消息只能有一个消费者 ●…