List: Amazon SageMaker | Curated by Ram Vegiraju

Mar 13, 2024
46 stories
3 saves
Amazon SageMaker
In
AWS in Plain English
by
Ram Vegiraju
Deploying Transformers ONNX Models on Amazon SageMakerAchieve High Scale Performance Utilizing Triton Inference Server With SageMaker Real-Time Inference
Mar 13, 2024
Mar 13, 2024
In
TDS Archive
by
Ram Vegiraju
Optimized Deployment of Mistral7B on Amazon SageMaker Real-Time InferenceUtilize large model inference containers powered by DJL Serving & Nvidia TensorRT
Feb 21, 2024
Feb 21, 2024
In
TDS Archive
by
Ram Vegiraju
Building a Multi-Purpose GenAI Powered ChatbotUtilize SageMaker Inference Components to work with Multiple LLMs Efficiently
Feb 7, 2024
1
Feb 7, 2024
1
In
TDS Archive
by
Ram Vegiraju
Deploying Large Language Models with SageMaker Asynchronous InferenceQueue Requests For Near Real-Time Based Applications
Jan 27, 2024
Jan 27, 2024
In
TDS Archive
by
Ram Vegiraju
Building an LLMOPs PipelineUtilize SageMaker Pipelines, JumpStart, and Clarify to Fine-Tune and Evaluate a Llama 7B Model
Jan 18, 2024
Jan 18, 2024
In
Towards AWS
by
Ram Vegiraju
MLOPs With SageMaker Pipelines Step DecoratorAn End to End Example of Feature Engineering, Training, and Inference Simplified with new SageMaker Pipelines Features
Jan 11, 2024
1
Jan 11, 2024
1
In
TDS Archive
by
Ram Vegiraju
Hosting Multiple LLMs on a Single EndpointUtilize SageMaker Inference Components to Host Flan & Falcon in a Cost & Performance Efficient Manner
Jan 11, 2024
Jan 11, 2024
In
AWS in Plain English
by
Ram Vegiraju
re:Invent 2023 AI/ML LaunchesMy personal overview of some of the key launches this year
Dec 4, 2023
Dec 4, 2023
In
AWS in Plain English
by
Ram Vegiraju
Integrating LangChain with SageMaker JumpStart to Operationalize LLM ApplicationsBuilding LLM-Driven Workflows
Oct 2, 2023
2
Oct 2, 2023
2
In
TDS Archive
by
Ram Vegiraju
Host Hundreds of NLP Models Utilizing SageMaker Multi-Model Endpoints Backed By GPU InstancesIntegrate Triton Inference Server With Amazon SageMaker
Sep 22, 2023
Sep 22, 2023
In
AWS in Plain English
by
Ram Vegiraju
Four Different Ways to Host Large Language Models on Amazon SageMakerPick the option that makes the most sense for your use-case
Aug 24, 2023
1
Aug 24, 2023
1
In
TDS Archive
by
Ram Vegiraju
Deploying Large Language Models With HuggingFace TGIAnother way to efficiently host and scale your LLMs with Amazon SageMaker
Jul 14, 2023
1
Jul 14, 2023
1
In
TDS Archive
by
Ram Vegiraju
Debugging SageMaker Endpoints With DockerAn Alternative To SageMaker Local Mode
Jun 16, 2023
Jun 16, 2023
In
TDS Archive
by
Ram Vegiraju
Deploying LLMs On Amazon SageMaker With DJL ServingDeploy BART on Amazon SageMaker Real-Time Inference
Jun 7, 2023
Jun 7, 2023
In
TDS Archive
by
Ram Vegiraju
Deploying Cohere Language Models On Amazon SageMakerScale and Host LLMs on AWS
May 18, 2023
May 18, 2023
In
AWS in Plain English
by
Ram Vegiraju
Deploy An MLOps Pipeline With Training, Model Registry, and Batch InferenceHarness SageMaker Pipelines With Batch Inference
May 10, 2023
1
May 10, 2023
1
In
TDS Archive
by
Ram Vegiraju
Deploying Multiple Models with SageMaker PipelinesApplying MLOps best practices to advanced serving Options
Mar 23, 2023
Mar 23, 2023
In
TDS Archive
by
Ram Vegiraju
Deploying SageMaker Endpoints With TerraformInfrastructure as Code With Terraform
Mar 14, 2023
Mar 14, 2023
In
TDS Archive
by
Ram Vegiraju
Load Testing Simplified With SageMaker Inference RecommenderTest TensorFlow ResNet50 on SageMaker Real-Time Endpoints
Mar 7, 2023
Mar 7, 2023
In
TDS Archive
by
Ram Vegiraju
Load Testing SageMaker Multi-Model EndpointsUtilize Locust to Distribute Traffic Weight Across Models
Feb 24, 2023
Feb 24, 2023